PRML 演習8.17

はじめに メッセージパッシングのあたりから怪しくなってきましたが,頑張って解きます. 本題 まず以下のような無向グラフを考える. 3と5が観測されているときに,を示す. 観測された場合は,以下のようになる. 上記のグラフよりからの経路は,ただひと…

beamerのToo many symbol fonts declaredの対処

はじめに emacsのorgmodeでorgファイルからbeamerに変換すると,エコンパイルが通らなかったのでその対処を書きます. (探したけど,全然なかった) マシンによって出たりでなかったりしたので,不思議です... 環境 emacs 24.5 (preludeを使ってます) ma…

2015年度版NDL全国書誌におけるNDC9の分布について

はじめに DMM.R18のデータだけ触ってるとそろそろ変質者のように見られてしまうので,図書館系のデータを使います.NDLの「全国書誌(作成完了書誌)」を取得 - 鴨川にあこがれる日々nzw.hatenablog.jp 2月20日から国立国会図書館(NDL)が公開している全国…

word2vecよりも高性能らしいGloVeを触ってみた

はじめに word2vecよりも性能が高いとかなんとか / “GloVe: Global Vectors for Word Representation” http://t.co/cZPAafJ6Zl #自然言語処理— ηozawa kento (@nozawa0301) June 4, 2015word2vecというツールが,かなり流行りました. そのあといくつも単語…

PRML 演習 8.14

はじめに 研究室の方針で卒論に直接関係する章を優先的に進めようということになり, 2章の途中から一気に下巻8章のグラフィカルモデルです.ちなみにグラフィカルモデルといえば,トピックモデル関連の論文にはほぼ必ず登場します.Amazon.co.jp: トピック…

word2vecのサブサンプリングのtについて

はじめに 昨年の研究とブログとバイトでword2vecを使ったので,そろそろちゃんと中身を理解しようとしました.*1とりあえず以下の論文を読みましたが,途中で引っかかったので,ブログにまとめておきます. 英語力不足などもあり,結局解決していません.wor…

PRML演習2.10 ディリクレ分布の共分散

Amazon.co.jp: パターン認識と機械学習 上: C.M. ビショップ, 元田 浩, 栗田 多喜夫, 樋口 知之, 松本 裕治, 村田 昇: 本amzn.to演習2.10は,ガンマ関数の性質を利用することをヒントにしつつ,式(2.38)のディリクレ分布の平均,分散,共分散を求めます.今…

PRML演習2.10 ディリクレ分布の分散

Amazon.co.jp: パターン認識と機械学習 上: C.M. ビショップ, 元田 浩, 栗田 多喜夫, 樋口 知之, 松本 裕治, 村田 昇: 本amzn.to演習2.10は,ガンマ関数の性質を利用することをヒントにしつつ,式(2.38)のディリクレ分布の平均,分散,共分散を求めます.今…

PRML演習2.10 ディリクレ分布の平均

Amazon.co.jp: パターン認識と機械学習 上: C.M. ビショップ, 元田 浩, 栗田 多喜夫, 樋口 知之, 松本 裕治, 村田 昇: 本amzn.to演習2.10は,ガンマ関数の性質を利用することをヒントにしつつ,式(2.38)のディリクレ分布の平均,分散,共分散を求めます. …

PRML 2.8 2変数を使った分散

お知らせ 突然数式が展開されなくなったので, PRML2章 に同様の式展開を記載しています. Amazon.co.jp: パターン認識と機械学習 上: C.M. ビショップ, 元田 浩, 栗田 多喜夫, 樋口 知之, 松本 裕治, 村田 昇: 本amzn.to演習2.8は,p72で言及されている式(…

PRML 2.8 2変数を使った平均

* 余談 当ブログのPRMLの解答は,矮小yousack.hateblo.jp と補完関係にあるため,どちらかに挙がっていれば,積極的に記事にはしない予定です. Amazon.co.jp: パターン認識と機械学習 上: C.M. ビショップ, 元田 浩, 栗田 多喜夫, 樋口 知之, 松本 裕治, …

gemのmongoが動かなくなった

はじめに 私的にNDLの全国書誌データのデータをRubyで集めてmongoDBに格納しています. 先日,mongoのgemをupdateしたら動かなくなったので,対処法を書きます. 環境 OS:centos mongo:2.6.9 gem mongo:2.0.3 本題 gemを1系のmongoから2.0.3にupdateしたら `<main></main>…

PRML演習2.7 解答

* 余談 当ブログのPRMLの解答は,矮小yousack.hateblo.jp と補完関係にあるため,どちらかに挙がっていれば,積極的に記事にはしない予定です. Amazon.co.jp: パターン認識と機械学習 上: C.M. ビショップ, 元田 浩, 栗田 多喜夫, 樋口 知之, 松本 裕治, …

PRML演習2.5 式2.265の導出

Amazon.co.jp: パターン認識と機械学習 上: C.M. ビショップ, 元田 浩, 栗田 多喜夫, 樋口 知之, 松本 裕治, 村田 昇: 本amzn.to式2.265の導出を行う.\begin{align} \Gamma(a)\Gamma(b) &= \int^{\infty}_0exp(-x)x^{a-1}dx \int^{\infty}_0exp(-y)y^{b-1}…

情報管理誌のRSSから抄録を入手するまで

はじめに 先日STI updatesと「情報管理」誌が新着情報のRSS配信を再開されました. STI updatesと「情報管理」誌が新着情報のRSS配信を再開 | カレントアウェアネス・ポータルarXiv.orgには抄録の情報もあるのですが,上記の情報管理誌にはなかったので,RSS…

「図書館及び関連組織のための国際標準識別子(ISIL)」を触ってみた

2015年5月8日に追記しました. はじめに 先日NDLで新しいデータとして図書館及び関連組織のための国際標準識別子(ISIL)が公開されました. オープンデータセット | 国立国会図書館-National Diet LibraryRDF形式のデータで馴染みがなかったので,簡単に触…

PRML演習2.6 ベータ分布の分散

Amazon.co.jp: パターン認識と機械学習 上: C.M. ビショップ, 元田 浩, 栗田 多喜夫, 樋口 知之, 松本 裕治, 村田 昇: 本amzn.to前回と同じ問題の続きPRML演習2.6 ベータ分布の平均 - 鴨川にあこがれる日々nzw.hatenablog.jpベータ分布の分散を求める.分散…

PRML演習2.6 ベータ分布の平均

Amazon.co.jp: パターン認識と機械学習 上: C.M. ビショップ, 元田 浩, 栗田 多喜夫, 樋口 知之, 松本 裕治, 村田 昇: 本amzn.toベータ分布の平均を求める.ベータ分布は連続変数の確率分布であるため,平均はp.19の式(1.34)を使う.\begin{align} \mathbb{…

JuliaTokyo#3でLTしてきた話

はじめに 数値計算に特化したプログラミング言語にJuliaというものがあります.*12014年の2月に初めて触ったんですが,当時はv0.2で速さがわかりませんでした.先月のはじめにあったハッカソンのサンプルコードになぜかJuliaがあり,それがきっかけで1年ぶり…

2014-8-21~2015-3-8までの「図書館」を含むツイートで遊んでみた(その1)

はじめに 約半年間,Twitterから特定のデータを集めました. それの簡単な集計を行いましたので,報告までに. 動機 2013年2月28日の私は 「図書館とビッグデータって組み合わせないかな」 とか言っていました.*1例えば 貸出履歴 無線LANの情報 来館データ …

日経電子版×クックパッド共催データハッカソンに参加した話(クックパッド賞頂きました)

追記(2015年3月9日03:15) こういう機会はあまりまだ多くないので,なんで楽しかったのか,何がよかったのかについて(主に環境)少し書こうかと思いました.本文下に追加しました. めっちゃ楽しかったし,こういうのが増えてほしい!!!!!111 前置…

NDLの「全国書誌(作成完了書誌)」を取得

要点 NDLの全国書誌一覧を使って情報量を増やしたjson形式のデータを取得するスクリプトを書きました. はじめに 私は,本のデータが欲しいことがあります. (MLのアルゴリズムを試す,最近出版された図書が気になる...など)まずは図書館が配信しているRSS…

herokuにあるsinatraアプリをcloneしてデプロイするまで

はじめに HerokuというPaaSがあります. RubyでいえばSinatraやRuby on Railsのアプリを簡単に公開できるサービスです.個人的には,ハッカソンやアプリコンテストなどのAPIサーバー代わりに使っています.heroku上にアプリがあるが,公開鍵をなくしてしまっ…

Developer Application Contest 3rdに参加した話

はじめに 先日,docomo主催のアプリコンテストがありました.Developer Application Contest 3rd | docomo Developer support | NTTドコモ研究室の面々とアプリコンテストに出ようという話題になった際,ちょうどよい時期にあったので,このコンテストを選び…

TwitterAPIを使ってソーシャルグラフを描く(描画編)

この記事はシステム主専攻ver1.0 Advent Calendar 2014の7日目の記事です.システム主専攻ver1.0 Advent Calendar 2014 - Adventar システム主専攻ver1.0 Advent Calendar 2014 - Adventar はじめに 前回の続きです. グラフの描画を行います.TwitterAPIを…

TwitterAPIを使ってソーシャルグラフを描く(データ収集編)

この記事はシステム主専攻ver1.0 Advent Calendar 2014の5日目の記事です. 現在は2015年1月ですが,細かいことは置いておきましょう.システム主専攻ver1.0 Advent Calendar 2014 - Adventar システム主専攻ver1.0 Advent Calendar 2014 - Adventar はじめ…

ポケスト公開しました

現在は停止しています はじめに ポケサー(ポケモンサークル)の知り合いが信州のリンゴを持っていたので,食べたくなって要望に答えました. ポケモンサークルはTwitterのアカウントを持っているらしく,それがどれだけアクティブなのか,一覧にしたかった…

Gephiで夢野久作「ドグラ・マグラ」の可視化

はじめに 最近,グラフ理論入門書を読みました. 入門書では用語が頻出するため,式を展開して計算して...というよりは,用語を覚えたり,概念を理解したりする部分が多い印象を受けました. 個人的には彩色問題,世界地図の塗り分け問題のあたりが読んでい…

MacへCommon Lispの導入

はじめに 現実逃避としてLispに興味がありました. S式,ポーランド記法,マクロ,Emacs,関数型... いろいろとキーワードは聞くわけですが,あんまり触ったことがなかったので,導入とHelloWorldくらいまでやろうと思います. 参考書など Amazon.co.jp:…

RのフレームワークShinyを使ってみる

R

はじめに インターンでデータを表示する簡単なアプリをRailsで以下のライブラリを使ってやったんですが, 画面ごとにcontrollerやメソッド作ったり,Rで解析した内容をRailsで表現し直したりで,面倒くさかった思い出があります. Highcharts - Interactive …