大量の発言からなる議論のまとめ方

普段は1発言ずつURLを拾い、それをTwitterClipにかけているのですが、今回の「大学での教育について」のような分量の多いまとめにそんな方法は使えません。私はこういう方法でまとめました。

  1. 議論に関わった人の発言すべてについて、議論が行われていた時間帯の発言をHTMLの状態で取得する。(APIだと取得できる件数に制限があるのでHTMLの方がよい。HTMLを一括して取得するプログラムを書くのが楽。)
  2. HTMLを見て、正規表現などを利用してプログラムを書き、HTMLから発言の内容・ユーザ名・発言のURLなどを取得してCSV(or TSV)で保存する。
  3. ExcelOpenOffice SpreadsheetなどでCSVを開き、一番左の列を1列開ける。
  4. 発言を読みつつ、今空欄を作った一番左の列に、まとめ記事に加えたい発言の行にのみ「1」を書き加える。他の行については空欄のままにする。
  5. 一番左の列をソート条件にしてソートし、まとめたい記事のみを集める。関係のない行は削除する。
  6. 以上の方法で編集した表をCSV( or TSV)で保存する。
  7. プログラムを書いてCSVを整形し、HTMLとして出力する。

プログラムを書くのは、Rubyなどのスクリプト言語を使うのが楽です。open-uri便利すぐる。

※5/20修正