[社群] 2016 Spark tw 最後一場公開活動

2016 Spark.tw最後一場公開meetup就在昨天圓滿結束

這篇文章算是參加後的筆記以及小小心得

包括 Ryan 與 國父 分享關於參加今年PIXNET hackathon拿到冠軍的幾隻模型

In this article, I’d like share my review for the hackathon meetup yesterday LOL, in Chinese XD.

分享心得

演講分上下部,Ryan會先介紹A.I. cloze的競賽規則以及在做word2vec的調整以及比較,接著國父會分享在操作language model的研究過程,搭配三種斷中文詞句的package以及兩種模型,六種組合的正確率到底誰輸誰贏?其中我覺得很有意思的是language model,而且比賽中選擇不用RNN的原因自然也跟效能有關,其實並不意外,能夠搶分成功才是重點,比賽前大家可以訓練自己的模型,正式比賽則有兩個階段:總分淘汰賽、搶答奪標賽。所以在回答問題時後得根據不同的競賽機制略做調整,包括timeout的調整等等。

中文與英文的language model本身就很不同,加上中文的斷詞句package目前市面上免費的不多,同時冠軍隊伍也有用unigram一起下去測試,發現其實最簡單的方法不一定最差,unigram + language model效果好到嚇嚇叫。

當然還有一些很聰明的小技巧,能用grep就搞定找到答案的,何須出動model?你說是吧?google search說不定就有答案啦!另外,在文本進來要做training時的工程系統考量也是一大環節,如果training一個模型要三天、跟10分鐘,時間有限青春也有限的情況下,你會選擇什麼呢?

最後的搶答制,冠軍隊伍的作法就是那一組模型先算出來就先答分!真的是秒答XD…加上正確率很高的情況下,一路穩拿寶座到比賽結束。非常恭喜他們!

永遠不能忘記你是在比賽,而不是想著100%拿到滿分。

其他

團隊分工以及困難點上,我也大概提問了一下 : ) 各司其職並且合作無間,搭配比賽策略,才是搶下冠軍的不二法門!同時很謝謝 dcard 公司在緊急的時候恰好有場地贊助 Spark.tw ,在這邊我由衷的感謝,雖然我弄直播失敗了= =+。

2016-12



迴響已關閉。


total of 2289475 visits