WEBサービス アプリケーション・ツール

テキストエディタを使って、「うたまっぷ」の歌詞をテキスト化する手順。

2013/11/23

「うたまっぷ」という、歌詞を掲載しているサービスがあるのですが、
著作権の問題からか、歌詞をコピーペーストで取得することが出来ません。

そこで、以下の手順でテキスト化に成功したので、忘備録としてポストします。
そんなに大したことはしていませんが、とりあえずこういう技があるよ、ってぐらいの意味合いで。

うたまっぷ歌詞をテキスト化

手順1 検索

歌詞を検索します。
サンプルとして、國府田マリ子の「僕らのステキ」を検索。

utamap_bokuranosuteki_01

手順2 ソース表示

任意の位置で右クリックから「ページのソースを表示」で
HTMLのソースを表示。

今回の例では185行目あたりにあった、歌詞部分まで移動。
大体、こんな感じのブロックが見つかると思います。

手順3 javascriptをコピペ

src="js_smt.php?unum=54962部分をクリックすると、javascriptのソースが歌詞と一緒に表示されます。

utamap_bokuranosuteki_02

表示されたら、全選択でコピー、秀丸にペースト。
1行のなが~いスクリプトがペーストされると思います。

手順4 スクリプトを改行する

「Ctrl」+「R」で置換ウィンドウを出し、

正規表現にチェックを入れ、
検索(S)に「;」、
置換(E)に「;\n」

を入力して実行。

utamap_bokuranosuteki_03

この画像のようになると思います。

utamap_bokuranosuteki_04

手順5 句形範囲で削除

あとは赤枠部分を消していけばいいわけですね。

(1)部分は普通に削除。

(2)部分は句形範囲を指定して削除。
句形範囲は、開始部分にカーソルを持って行き、「Shift」+「Alt」を押しながら、マウスカーソルを任意の位置に持っていけば選択できます。

句形で範囲指定すると、こんな感じ。

utamap_bokuranosuteki_05

何回か試すと感じがわかると思うので、慣れるまで遊んでみましょう。

手順6 正規表現で削除

では、最後の手順。
現在、先頭から、こんな感じだと思います。

「歌詞があり、シングルクォーテーションがあって、数字~が並んで、改行」という定形です。

先頭行、先頭文字(悲)にカーソルを合わせた状態から、「Ctrl」+「R」で置換ウィンドウを出し、

正規表現にチェックを入れ、
検索(S)に「'.*」、
置換(E)は空白

を入力して実行。

実行後はこんな感じ。

utamap_bokuranosuteki_06

これにてテキスト化成功!

慣れれば2分ぐらいで出来そう。
というか、マクロ組んで一発で出来そうな気もします。

先にも書きましたが、とりあえずこういう手段があるって程度の技でした。

-WEBサービス, アプリケーション・ツール
-, , ,