読者です 読者をやめる 読者になる 読者になる

鴨川にあこがれる日々

軽い技術っぽい記事かいてます

相づちをとりだしたらそれっぽくなった話

こんにちは

はじめに

ちょうど最近TwitterBotをつくったのですが,なにを喋らせようか迷っていました.*1
twitter.com

以前やったこれが使えそうです.nzw.hatenablog.jp

しかし残念ながら以下の

  • 言葉が古い
  • 会話であってもかぎかっこが連鎖しているとは限らない(会話が取り出せない)

という点において青空文庫の会話が使いにくかったので,趣向を変えてみました.

本題

会話にならなくてもいいので,相づちをしてもらうことを目指します.

まず,前回の記事で取り出した発言に対して,句点で分割して一言ずつ取り出しました.
複数回出現した一言は,相づちである可能性が高いと考えられます.

例えばこれは,夢野久作著「ドグラ・マグラ」から取り出した例です

,'アハハハハハ','ハハハハハハ',
'アッハッハッハッハッ',
'何が胎児をそうさせたか',
'あっ',
'ハッハッハッハッ',
'……う……うん……',
'……………………',
'夢',
'ふーむ',
'ハッハッハッ',
'ハハハハハ',
'ハイ',
'うん',
'いや',
'胎児の夢',
'……………'

無関係そうなものは取り除いています.

"胎児の夢"のようにドグラ・マグラ特有の一言がでてきてしまいました.
他の作品に関しても同様に一言を抽出し,少なくとも2回以上出現したらBotの相づちとして採用するのが良いかと思っています.

試しに4作品から使えそうな相づちを抽出した結果です.

reply = ['いない','そうだ','へえ!','ここだよ','さよなら','そうだよ',
         '困ったね','そのとおり','お幸せに','なにかさがしてるの?',
         'まったくもってわからん','いわれてるから','うん','どうして?',
         'そうだね……','ここでなにしてるの?','きみを、ひとりにはしない',
         'ちゃんとしてるんだ、わたしは','どういうこと?','えっ?','むむむ',
         'こんばんは','さようなら','こんにちは','アハハハハハ','ハハハハハハ',
         'アッハッハッハッハッ','何が胎児をそうさせたか','あっ','ハッハッハッハッ',
         '……う……うん……','……………………','','ふーむ','ハッハッハッ',
         'ハハハハハ','ハイ','うん','いや','胎児の夢','……………',
         'いいえ','これだわ','いやどうして','そうでしょう','ところがねえ',
         'そうなるかしら','ようくわかりました','それは、またなぜにです?',
         '明察です','なるほど……','そうなんだわ',
         'そうです','なるほど','冗談じゃない','ええ','ありがとう'
        ]

現状は自作のTwitterBotがこれらの中からランダムに取り出して相づちをうってくれます.
ランダムも馬鹿にできなくて,たまにこんな風に会話っぽくなることがあります.

f:id:another16javac:20150715003733p:plain
botでもそれらしいことを言えば会話が成り立っているように思えますね.

以上です.

*1:ちなみに別機能として図書館情報学図書館の新着図書をお知らせする機能もあります