靖宏 河畑2020年1月17日読了時間: 2分偏りがあるデータの分析機械学習用に用意されているデータはきれいに整えられていて、データの下準備からモデルの作成まで実にすんなりといくものが多いです。でも実社会のデータはほとんどが大なり小なり偏りがある方が普通。 そんな例を見てみます。 データを取り込みます。トレーニング用に148の特徴量のデータ...
靖宏 河畑2020年1月13日読了時間: 2分赤ワインの成分と品等機械学習は回帰ばかりではなく、分類器としても広く使われています。 教科書に載っているようなデータばかりじゃ飽きるので、今回は無料で公開されているデータセットの中から、赤ワインの成分と品等との関係をモデル化してみたいと思います。 まずはデータの取得。...
靖宏 河畑2020年1月12日読了時間: 1分機械学習でボストンの住宅価格を予測する機械学習を学び始めると、ボストンの住宅価格を使ったモデルによく出くわします。 ボストンの住宅の売買価格と、13個の不動産鑑定評価でいうところの価格形成要因(機械学習では特徴量といいます)の関係を線形回帰で表すものです。 やり方はごく簡単で、 まずモデルを作る準備で...