2008年2月5日火曜日

正規表現でHTMLの見出しを抽出する

bregonig.dllを使いたくて「ヘッダファイル作ろうかなー」と考えていたら既に月影ともさん(と猫太さん)が作成されていました。
COMによる正規表現は何かと不便なので、今後重宝しそうです。
リンク先を変更。[08/05/03]

// つーさのくーかん「物置 > HSP3 > BREGEXP.hsp」
// http://tu-sa.net/0360

#runtime "hsp3cl"
#include "bregexp.hsp"
    dialog "htm;*.html"16"見出しを抽出するHTMLファイル"
    if stat == 0 : end

    notesel file
    noteload refstr
    position = 0
    margin_left = "-""--""---""----""-----""------"
    repeat
        result = BMatch(file, position, "m#<[hH]([1-6])[^>]*>(.*)</[hH]\\1>#k")
        if result == -1 : break

        mes margin_left(int(BMGetStr(1))-1) + BMGetStr(2)
        position += BMGetNextPos()
    loop
    stop

0 件のコメント: