matobaの備忘録

和歌山と東京を往復しつつ活動するエンジニアの記録

PyConJP 2017に行って来ました。(全体まとめ)

PyConJP 2017に行って来ました。 たくさんツイートしたのでだいぶ貼り付けた。適当な事ばっかり言ってるのが目につくな。。。

初日

基調講演の話

基調講演の話だけ、昨日書きました。

blog.mtb-production.info

変数アノテーションの話

最初の方、話についていけなかった。でも、よくわからんという話をボソボソとTwitterでつぶやいていたらなんでこんな話になっているのかを教えてもらえて最終的にはついていけた。

speakerdeck.com

Apache SparkとかPySparkの話

SparkとかPySparkを使ったことないけど気になっていた。Sparkを使う、というのがどういう話なのかを知れてよかった。とりあえず、pandasとscikit-learnとdaskを使う or PySparkを使う、みたいな選択になりそうなイメージ。

今の所、前者は、試行錯誤しやすい。後者はスケールしやすい。みたいな理解。そして、今の所、pandasとpyspark間のデータフォーマットの変換は結構重いらしい。(Apache Arrowに期待が集まる)

speakerdeck.com

Djangoフレームワークのユーザーモデルとか認証の話

ブースを見ていて、途中からの参加になった。 途中からの参加すぎて、話についていけなかったので、スライドを確認したい。

www.slideshare.net

len()関数がオブジェクトの長さを手に入れる仕組み

PyConJP2017っぽいスライドマスターが印象的でした。 なるほどお。と思う話ばかりで、Pythonについて勉強させてもらいました。

www.slideshare.net

自然言語処理 とかディープラーニングの話

アカデミックな論文発表っぽいなあと思っていた。 アカデミックな領域から出てから思うのが、アカデミックな論文発表って、何かをやるときに、なんでそれをやっているのか、という話がすごい長いなあと思う。

僕は、どっちかというと、どうやってそれをやったのか、とか技術的な話を知りたい。モチベーションの方は、まあ論文読んだり飲み会で話をしたらいいのかなと思っている部分がある。もうちょっと中の話が聞きたかったなあという印象。論文を読もうかなあ。

www.slideshare.net

djangoパーミッション管理の話

djangoパーミッション管理の話。 アプリケーションとかサービスを作る話を聞いていると、どこもパーミッション管理の話である程度悩むように思うので、為になる話でした。

www.slideshare.net

セキュリティと機械学習の話

徹底的に自動化しようとしているところが、すごい印象に残った。 途中で、検査値を自動生成する話があって、GAでそれらしい検査値を作った後に、それを元にして、GANで大量の検査値を生成していて、なるほどと思った。

www.slideshare.net

二日目

keynoteの堀越さんのpandasのOSSコミッターとしての話

pandasとかOSSにコントリビューションすることの話が印象的だった。 今までOSSってどうやって動いているんだろう、と思っていたところがあったけど、その気持ちがだいぶ薄れた。何かできることがあれば、やっていきたい気持ちはある。

Pythonで実現する4コマ漫画の分析の話

自分が好きなツールを自分で開発している話。楽しそうだった。僕も自分が欲しいものを自分で作っていきたいと改めて思った。

slideship.com

SQLAlchemyの話

SQLAlchemyの話。ORMって、よく聞くけど、具体的になんなの?って思ってたけど、あーあれがORMかあと思ったりしながら聞いてた。途中で話についていけなくなったので、スライドを見返したい。

ジョブフェアでグローバルに働くために英語をやろう、という話

グローバルに働きたい人って減ってるのか、Pythonの人がグローバルに働きたいと思っていないのかわからないけど、少ないなあと思った所存。僕は、やりたいことをやる為に結果的にグローバルになるのはいいと思うんだけど、海外で働きたいという欲はないかなあという気持ち。

補足すると、ドキュメントはGoogle翻訳するんじゃなくて自分で読むほうがいいように思っている。ただ、自分の訳が不安だったり、英語の文章が、頭にスッと入ってこないので、とりあえずGoogle翻訳にどんな雰囲気の話を確かめてから、具体的に英文を読んでいたりする。でも、ドキュメントの場合、結局コードがあるので、文章としては、雰囲気わかればだいたい事足りているところがある。

ドメイン駆動設計の話

とりあえず、ドメイン駆動設計は、変化に強くなる代わりにスピード感がなくなるということを理解することができた。

www.slideshare.net

機械学習におけるデータの再現性の話

会社で仕事としてデータ分析をしていくときに悩ましい話だなあと思った。これから色々僕も検討していきたいと思っている。

speakerdeck.com

ディープニューラルネット確率的プログラミングライブラリEdward

難しかった。とりあえずなんかすごそう。と思ったので、スライドを見て、知らない技術単語について調べるところから始めたい。

www.slideshare.net

後「ベイズ統計モデリング: R,JAGS, Stanによるチュートリアル」がいいという話を聞いた。

Pythonの並列処理とか並行処理の話。

なんとなく知っているような知らないような話をきちんと整理してもらえてありがたかった。標準ライブラリを知ることができて勉強になりました。

Pythonをとりまく並行/非同期の話

サーバーレスの日本語形態素解析の話

日本語形態素解析に興味があった。ノーマライズとかサニタイズとかしていて、なるほどなるほど。って思った。あと、合名詞も結構印象的だった。

まとめ

PyConJP 2017は、Output& Followがテーマだった。

僕は、PyConJP2017で何かを発表することはなかったけど、ひたすらツイートで、思うことをアウトプットした。すると、たくさんの人にツイートした疑問をフォローしてもらえた。そして、僕は、このブログで、自分自身のアウトプットをさらにフォローしていきたいと思っています。

今後、やりたいこと。

せっかくなので、僕のツイートを振り返りながら、自分が今後やりたいと思うことについて書き出しておこうと思います。

  • wheelの仕組みを学びたい
  • 変数アノテーションを使ってみたい
  • unmarshalerが何か分からなかったので、使ってみたい
  • pysparkを気が向いたら使ってみたい
  • apache arrowが気になるので、調べておきたい
  • GANとかCNNとかもう、よく分からないやつが結構あるので、色々調べなおしたい
  • 著作権に関する議論をもうちょっと調べてみたい
  • 自然言語処理Deep learningは気になっている
  • 各種スライドを見直して、よく分からないところを洗い出したい
  • SQLAlchemyを使ってみたい
  • ヘキサゴンアーキテクチャとかCQRSとかドメイン駆動設計をもう少し知っておきたい
  • 組織的なデータ分析というのは、もう少し深掘りして考えていきたいと思う所存。
  • 自然言語処理をもっとやりたいなあと思った

おまけ:togetter

togetter.com