Kaggle(カグル)は企業研究者がデータを投稿し、世界中の統計家やデータ分析家がその最適モデルを競い合う、予測モデリング及び分析手法関連プラットフォーム及びその運営会社である。モデル作成にクラウドソーシング手法が採用される理由としては、いかなる予測モデリング課題にも無数の戦略が適用可能であり、どの分析手法が最も効果的であるかを事前に把握することは不可能であることに拠る。

Kaggle
業種 予測モデリング
設立 2010年4月
創業者 Anthony Goldbloom, Ben Hamner
本社 アメリカサンフランシスコ
所有者 Alphabet (企業) (2017–現在)
親会社 Google (2017–現在)
ウェブサイト www.kaggle.com

2017年3月8日、GoogleはKaggle社を買収すると発表した[1][2]

会社の標語は、"Making Data Science a Sport"。

流れ

編集
  1. 課題投稿者はデータ及び当該課題の説明が必須である。Kaggle社は、課題作成の支援、課題構成作成、データの匿名化、当該課題への最適モデルの運用などのコンサルティングを担当する。
  2. 参加する回答者は多様な手法を試し、最適モデル構築を目指し競い合う。大抵は投稿結果が即座に(秘匿化した課題に対する提出モデルの予測精度に基づき)採点され、上位順に掲載される。
  3. 期限後、課題投稿者が提出モデルの使用にあたり永続的に取消不能である無償利用権(その中には、開発したアルゴリズムソフトウェア及び関連知的財産権が含まれ、"特に断りのない限り包括的"に有効。[3])に同意した回答者に賞金を支払う。

公開課題の他、ヘビーユーザーや大学団体[4]など参加者を限定した課題も提供している。

影響

編集

情報科学統計学経済学数学などの分野から全世界で約95,000人のデータサイエンティストが登録しており[5]、同社はアメリカ航空宇宙局ウィキペディアデロイト トウシュ トーマツオールステート保険等の組織と提携している。 Heritage Health Prizeによる300万ドルの賞金課題で話題となり、[6] 最近の事例ではKinectの挙動認識改善課題が知られている。[7]

公開課題方式により、HIV研究への最新技術の促進[8] 、より正確なチェスレイティング[9]交通量予測[10]など、多くの課題解決につながった。即座に反映されるスコアボードが、回答者に既存の最適解を超えた革新策を導出させる動機付けとなっている。[11]模範回答は頻繁に公式ブログに掲載されている。

DeNAでは人材育成や技術者の勧誘などに利用している[12]

脚注

編集
  1. ^ Google is acquiring data science community Kaggle”. Techcrunch (March 8, 2017). March 9, 2017時点のオリジナルよりアーカイブ。March 9, 2017閲覧。 “Sources tell us that Google is acquiring Kaggle [...] the official announcement could come as early as tomorrow.”
  2. ^ “Google buys Kaggle and its gaggle of AI geeks” (英語). CNET. (2017年3月8日). https://www.cnet.com/news/google-buys-kaggle-and-its-gaggle-of-ai-geeks/ 2018年6月1日閲覧。 
  3. ^ Kaggle. “Terms and Conditions - Kaggle”. 13 May 2011閲覧。
  4. ^ Kaggle. “Kaggle in Class”. 20 June 2011閲覧。
  5. ^ Kaggle. “About Us”. 11 July 2011閲覧。
  6. ^ “Healthy Competition”. The Economist. (April 10, 2011). http://www.economist.com/blogs/babbage/2011/04/incentive_prizes 3 May 2011閲覧。 
  7. ^ Byrne, Ciara (December 12, 2011). “Kaggle launches competition to help Microsoft Kinect learn new gestures”. VentureBeat. http://venturebeat.com/2011/12/12/kaggle-competition-microsoft-kinect-learn-new-gestures/ 13 December 2011閲覧。 
  8. ^ Carpenter, Jennifer (February 2011). “May the Best Analyst Win”. Science Magazine. http://www.sciencemag.org/content/331/6018/698.summary 1 April 2011閲覧。 
  9. ^ Sonas, Jeff (20 February 2011). “The Deloitte/FIDE Chess Rating Challenge”. Chessbase. http://www.chessbase.com/newsdetail.asp?newsid=7020 3 May 2011閲覧。 
  10. ^ Foo, Fran (April 6, 2011). “Smartphones to predict NSW travel times?”. The Australian. http://www.theaustralian.com.au/australian-it/smartphone-used-to-predict-nsw-travel-times/story-e6frgakx-1226034533295 3 May 2011閲覧。 
  11. ^ Athanasopoulos, George; Hyndman, Rob (2011年). “The Value of Feedback in Forecasting Competitions”. International Journal of Forecasting 27: pp. 845–849. http://www.sciencedirect.com/science?_ob=MImg&_imagekey=B6V92-52S72B8-1-1&_cdi=5886&_user=559483&_pii=S0169207011000495&_origin=&_coverDate=09%2F30%2F2011&_sk=999729996&view=c&wchp=dGLzVzb-zSkWl&_valck=1&md5=7c0b261207c4204b14d21a95adc9d6bb&ie=/sdarticle.pdf 
  12. ^ DeNA、世界大会でAI腕磨き 本業ゲームに還元”. 日本経済新聞 (2021年11月1日). 2021年11月1日閲覧。

関連図書

編集
  • 門脇 大輔, 阪田 隆司, 保坂 桂佑, 平松 雄司 :「Kaggleで勝つデータ分析の技術」、技術評論社、ISBN 978-4297108434 (2019年10月9日)。
  • 坂本 俊之:「データサイエンスの森 Kaggleの歩き方 」、シーアンドアール研究所、ISBN 978-4863542938(2019年10月22日)。
  • 石原 祥太郎, 村田 秀樹:「PythonではじめるKaggleスタートブック」、 講談社(実践Data Scienceシリーズ)、ISBN 978-4065190067(2020年3月19日)。

関連項目

編集

外部リンク

編集