鴨川にあこがれる日々

気持ちが強いほうのブログ

NLP

NNLMで城ヶ崎美嘉のセリフを学習してみた

はじめに これに関係した記事になります. nzw.hatenablog.jp 当時はnumpyを使ってNNを記述しましたが,ここ最近は遊びでchainerとかkerasなどのライブラリを使っています. 今回は思いつきでkerasでセリフの再現ができるが試してみました.手前味噌で申し訳…

word embeddingsの演算とデータセットについて知ってること

NLP

はじめに 自分が使った分だけですが,まとめました 評価の話 学習した分散表現の評価方法としてよく見るのは word similarity analogy です*1.この2つであれば omerlevy / hyperwords — Bitbucket に評価値を計算するPythonスクリプトとデータセットが入っ…

城ヶ崎美嘉(CV:佳村はるかさん)の誕生日なので,セリフが城ヶ崎美嘉か城ヶ崎美嘉じゃないかを多層パーセプトロンで判別してみた

注意 深層学習じゃありません. はじめに 私はPではないので知りませんでしたが,今日は「アイドルマスターシンデレラガールズ」の城ヶ崎美嘉(CV:佳村はるか)の誕生日です.twitter.comおめでとうございます!ちなみに佳村はるかさんといえば「SHIROBAKO」…

PythonでKullback-LeiblerダイバージェンスとJensen-Shannonダイバージェンス

11月5日追記 最下部に追記しました. 前置き 2つの確率分布の違いを表す指標にKullback-Leiblerダイバージェンス(以下KLダイバージェンス)とJensen-Shannonダイバージェンス(以下JSダイバージェンス)があります.詳しいことは言語処理のための機械学習入門 (…

自然言語処理を自習したくなったら参考になりそうなサイトなど

雑にですが,知ってるサイトやチュートリアルをまとめたくなったのでまとめてみました.夏ですし. 適宜更新しています.最終更新 2018年02月03日 チュートリアル 言語処理100本ノック 言語処理100本ノック 2015東工大の岡崎先生が作られたチュートリアルで…