NLP

NNLMで城ヶ崎美嘉のセリフを学習してみた

はじめに これに関係した記事になります. nzw.hatenablog.jp 当時はnumpyを使ってNNを記述しましたが,ここ最近は遊びでchainerとかkerasなどのライブラリを使っています. 今回は思いつきでkerasでセリフの再現ができるが試してみました.手前味噌で申し訳…

word embeddingsの演算とデータセットについて知ってること

NLP

はじめに 自分が使った分だけですが,まとめました 評価の話 学習した分散表現の評価方法としてよく見るのは word similarity analogy です*1.この2つであれば omerlevy / hyperwords — Bitbucket に評価値を計算するPythonスクリプトとデータセットが入っ…

城ヶ崎美嘉(CV:佳村はるかさん)の誕生日なので,セリフが城ヶ崎美嘉か城ヶ崎美嘉じゃないかを多層パーセプトロンで判別してみた

注意 深層学習じゃありません. はじめに 私はPではないので知りませんでしたが,今日は「アイドルマスターシンデレラガールズ」の城ヶ崎美嘉(CV:佳村はるか)の誕生日です.twitter.comおめでとうございます!ちなみに佳村はるかさんといえば「SHIROBAKO」…

PythonでKullback-LeiblerダイバージェンスとJensen-Shannonダイバージェンス

11月5日追記 最下部に追記しました. 前置き 2つの確率分布の違いを表す指標にKullback-Leiblerダイバージェンス(以下KLダイバージェンス)とJensen-Shannonダイバージェンス(以下JSダイバージェンス)があります.詳しいことはamzn.to の1.6を参考にしてくだ…

gloveとかword2vecの性能の測り方

追記 記事書いた後にこんな論文があったのでまとめています. Evaluation methods for unsupervised word embeddings EMNLP2015 読み会 from nzw Nozawa www.slideshare.net はじめに アクセスログをみているとgloveの記事nzw.hatenablog.jpがずっとアクセス…

自然言語処理を自習したくなったら参考になりそうなサイトなど

雑にですが,知ってるサイトやチュートリアルをまとめたくなったのでまとめてみました.夏ですし. 適宜更新しています.最終更新 2016年08月19日 チュートリアル 言語処理100本ノック 言語処理100本ノック 2015東北大学の乾・岡崎研究室の岡崎先生が作られ…