2019年08月21日

歌詞サイトから歌詞をテキストで取り出す方法

 テレサ・テンの動画に歌詞の字幕をつけるのに、いちいち打ち込むのは大変…だけでなく、本当に本来の歌詞通りに歌っているのかのチェックをするためにも、歌詞サイトは役立ちます。(中には歌詞を間違えているところもありますが。)

lyrics01.pngx

 ただし、歌詞サイトでは(多分、著作権の制限により)そのまま歌詞のテキストをコピーできません。

 そこで私がやっている方法です。
 私が使っているブラウザはchromeです。右上のメニューボタン(…が縦になっている)をクリックしてメニューを開き、「その他のツール」→「ディベロッパーツール」と進みます。

lyrics02.png


 ウインドウの中央列に、ページのソース(の概要)が開きます。
 これを上下になぞると、それぞれの行に該当するページの位置が薄い青色で表示されます。歌詞が青色で表示される行を見つけます。

lyrics03.png


 ソースの右向き三角(右向き三角1)はまだ、その中に詳細な記述があるという意味ですから、そこをクリックします。(展開すると下向き三角▼になります。)
 クリックするとそこが展開されますので、さらにターゲットとなる部分(歌詞)を探していきます。

 歌詞が最終的に現れたら、その行で右クリックしコンテキストメニューを表示し、「Edit as HTML」を選びます。

lyrics04.png


 歌詞がまとまって表示され、コピーできるようになります。

lyrics05.png


 これをテキストエディターに貼り付けます。
 HTML編集用ですので、<div>や<br>などのタグが含まれます。多分全部削除して構いませんが、<br>や<p>は改行位置を示すことになるので、注意が必要です。

 私は
を改行に置換できるテキストエディターを持っていないので。そのままそれをファイルとして保存します。中身はテキストですが、例えばtemp.htmlというファイル名で(拡張子は.txtでなく、.htmlとする)して(たとえばデスクトップに)保存します。
 そしてこれをブラウザで開きます。

lyrics06.pngx


 <br>の部分は改行されているので、このままコピーして、必要なアプリに貼り付けるなどします。

 歌詞のソースを別のファイルから読み込むなどの細工をしている歌詞サイトもあり、その場合にはこの方法は使えませんが、たいていはこれでテキスト抽出が可能です。

 ほかにももっと簡単な方法もあるかも知れませんが、以上が私の方法です。
-----
追記
 日本語の歌詞について、クレームが来そうなので、歌詞を読み取れる画像を削除しました。







posted by kewpie at 23:00| Comment(0) | TrackBack(0) | パソコン
この記事へのコメント
コメントを書く
お名前: [必須入力]

メールアドレス:

ホームページアドレス:

コメント: [必須入力]

認証コード: [必須入力]


※画像の中の文字を半角で入力してください。
この記事へのトラックバックURL
http://blog.sakura.ne.jp/tb/186466283
※ブログオーナーが承認したトラックバックのみ表示されます。
※言及リンクのないトラックバックは受信されません。

この記事へのトラックバック
コメントの投稿について
○お名前とコメント欄の記入は必須です。
○メールアドレスは任意です。記入されても公開はされません。管理人のみに知らされます。
○スパム防止のため、
・ホームページアドレス欄への記入はできません。
・コメント欄にURLは記入できません。
・スパムと思われる語を記入できません。
 これらをしようとすると、最終的に投稿完了できません。
○投稿完了後に、管理人の判断でスパムと判断した投稿は削除させていただきます。