Kaggleをやってみた

Kaggle

勉強会参加

経緯

  • 医療系のKaggle勉強会があり参加

説明

概要

データセットカーネル

  • データセットとは学習用データ
  • カーネルは先輩データサイエンティストさん達が構築したモデルやデータセット処理のコードが公開サイト
  • CopyEditボタンを押すと誰かの書いたサンプルコードを自分上に展開し実行できる
  • 実際にやってみた。以下データセットを用いた

題材データセット

  • 子宮頸がん

対象者(カラム)

  • 性病、感染症等をしている人
  • 抗がん剤、性病、その他病気の薬剤歴
  • 年齢
  • 妊婦さん
  • 避妊薬ピルをつかった経験
  • 喫煙者

やってること

  • 各カラムにおける陽性になる場合の関連性

わかったこと

  • 性病と子宮頸がんは関係ない
  • 抗がん剤をもちいると他の薬との併用が難しくなる
  • HPVと血液検査(腫瘍マーカ)の関連性は低かった。子宮頸がんとHPVの関連性はつよいはずなのに
  • あとでみたわかったが、子宮頸がん検知する腫瘍マーカがないため血液検査ではわからない