読者です 読者をやめる 読者になる 読者になる

鴨川にあこがれる日々

軽い技術っぽい記事かいてます

日経電子版×クックパッド共催データハッカソンに参加した話(クックパッド賞頂きました)

追記(2015年3月9日03:15)
こういう機会はあまりまだ多くないので,なんで楽しかったのか,何がよかったのかについて(主に環境)少し書こうかと思いました.本文下に追加しました.



めっちゃ楽しかったし,こういうのが増えてほしい!!!!!111

前置き

あくまで私個人が参加した感想です,あしからず.


はじめに

3月7日に日経新聞社とクックパッド社で共同開催されたデータハッカソンに参加しました.
概要は以下のリンクから

参加したハッカソンはこれで2回目になりました.

この日限定で公開されるデータなどを元にしてデータ解析を行いました.
(参加した目的はこれです,データ大好き)
(もちろんイベント後削除しました)

使ったもの

内容

今までのハッカソンと違ってプロダクトを作らなくてもアプローチや解析した結果で評価されることが大変魅力的でした.
甘いと言われそうですが,よくあるハッカソンって結局のところテーマについて考えたことが審査員にどれから響くかであって,UIとかプレゼンで評価される(もちろんそれも重要なファクタではありますが)ので個人的に面白くないと感じていました.エンターテイナーが勝っちゃうんだなぁと


普段プログラミングしない文系な方から言語処理の研究をされてる方まで,幅広く参加されていました.
参加した学生は約20人で,当日にチームを組んで7チーム発表しました.


個人的に
「word2vecを使った代替食材発見を取り組んだし,DEIM2015に参加しなかったし,これを拡張したいなぁ」
というモチベーションで参加しました.
日経新聞様のデータは以前触ったことがあったので,今回は触りませんでした...


以前の研究

CiNii 論文 -  word2vecを用いた代替食材の発見手法の提案 (データ工学)


ただ,数日前にCookpadの社員さんがword2vecを使った記事を見つけてしまいましたが,気にせず取り組みました.
使った例はこちら

義理といえば?クックパッドのレシピをword2vecで料理してみた - クックパッド開発者ブログ
(有賀さんめっちゃいい方でした.)


データが当日限定だったので,最終的な発表内容につきましては公開できません.
ごめんなさい.

結果

クックパッド賞を頂きました.
チームメイトの方,サポートしてくださったスタッフの皆様,ありがとうございました.


f:id:another16javac:20150308010632p:plain
いろいろ入ってますヽ(゚Д゚ )ノ

めっちゃ楽しかったし,こういうのが増えてほしい!

所感

両社ともにエンジニアの方々も,学生に教えつつ,一緒にデータを使って開発されていて,楽しそうな印象を受けました.
(とても楽しそうな職場だと思いました.羨ましい)

エンジニアの方と機械学習の話をできることが有意義でした.
実務に直接結びつく視点があるので,普段感じない考えでした.

最後にもう1回
めっちゃ楽しかったし,こういうのが増えてほしい!!!!!111


追記事項

なんで楽しかったのかを環境面について述べます.

1.データがきれい

エンジニアの方がおしゃっていたのですが,今回は予めクレンジングしたデータを提供してもらいました.

今回のように短時間でのデータハッカソンで生データをそのまま出されると,前処理で時間をほとんど使い果たしてしまうことがありうるかと思います.
(もちろん,生データとはそういうものだと思いますし,私はそれでも楽しいとは思いますが,おそらく少数派意見)
ある程度綺麗になっていると少しコードを書くだけで済むので,解析する時間が長くとれると思います.
なので解析に集中できて楽しかったです.

2.データのフォーマット

データによって違うのですが,JSONCSVAPI経由でデータを使うことができました.
以前参加した新聞五紙*1のときに,各社ばらばらのAPIがあり,それぞれアクセス負荷をあまりかけないでほしい,ということでだいぶ不自由でした.

今回のハッカソンは,基本的にJSONCSVなどAPIを介さない形で提供されていたので,よかったです.
(もちろん企業ごとに何かと事情があるかと思いますので,学生のわがままな感想です...)

3. 連絡ツール

スタッフさんと参加者はあらかじめSlackに事前登録していました.
当日書かれたサンプルコードや連絡などの共有がSlackを介して行われるので,連絡がスムーズでした.

分かれたチームごとでもやりとりができるので,かなり助かりました.


以上です.