マハル

プログラミング

Google Colabの使いかたを徹底解説!【Pythonの環境構築不要】

この記事では、Google Colaboratory(通称Colab)の使い方を説明します。私は、AIエンジニアとして、仕事でもGoogle Colabを使っています。Google Colabをはじめるために必要なものは、Googleアカウ...
機械学習

交差検証(クロスバリデーション)とは?最終的にどう評価すればいいの?

この記事では、交差検証(クロスバリデーション)について解説しています。交差検証は、機械学習モデルの性能を正しくはかるために必須の知識です。どんなに機械学習をまなんでも、性能が上がったのかどうか評価できなければ、意味がありません。交差検証のや...
機械学習

過学習(オーバーフィッティング)とは?原因から防止策まで【機械学習ガイド】

過学習(オーバーフィッティング)は、機械学習でよく直面する問題です。機械学習でもっとも気を付けなければいけないポイントです。本記事では、過学習の基本、原因、具体例、そして防止策について詳しく解説します。過学習とは?過学習とは、機械学習モデル...
機械学習

正規化と標準化の違いとは?【データ前処理の基礎知識】

データ分析や機械学習では、「正規化」「標準化」はよく使われます。本記事では、それらの手法を解説し、それぞれの適用シーンやメリット・デメリットについて掘り下げていきます。正規化とは?正規化は、データのスケールを統一する手法です。具体的には、デ...
仮説検定

有意水準と検出力とは?【はじめて学ぶ方むけに解説】

前提:仮説検定の考え方有意水準と検出力は、仮説検定という分野で出てきます。まずは、仮説検定の基本を知るために例題を見てみましょう。例題あなたは新しい薬を開発しました。今まで販売されていた薬とくらべて、新薬に効果があるかどうかを試したいです。...
確率分布

確率分布とは?基本から応用まで徹底解説!【確率変数から応用例まで】

確率分布とは?基本概念を理解しよう確率分布は、バラバラのデータから、現象を理解して、予測や意思決定をおこなうためのツールです。たとえば、製造業の不良品発生データから、不良品が発生しているのにはどのようなパターンがあるのか、を知ることができま...
機械学習

ロジスティック回帰の仕組みと応用例を初心者向けに解説!【オッズ・オッズ比】

線形回帰とは何が違う?ロジスティック回帰とはロジスティック回帰とは、「メールがスパムかどうか」「商品が不良品かどうか」「顧客が商品を買ってくれるかどうか」など、0か1かを判断するモデルです。これらは二値分類とよばれていて、ロジスティック回帰...
機械学習

ROC曲線とAUCをわかりやすく解説【機械学習の評価指標】

ROC曲線の基礎ROC曲線とは、機械学習の二値分類の良さをグラフで表したものです。二値分類とは、病気にかかっているか、製品が不良品かどうか、など0または1に分類できる問題のことです。二値分類モデルとしては、ロジスティック回帰が有名で、次の記...
機械学習

混同行列の見方を分かりやすく解説!【正解率・適合率・再現率・F1スコア】

混同行列とは混同行列(Confusion Matrix)は、機械学習の二値分類の性能をはかるために使われます。二値分類とは、Yes/Noで表すことのできる問題で、ビジネスでは下記のような例があります。医療診断で、病気にかかっているかどうかを...
データベース

【初心者向け】データベースとは?SQLと何が違うのか解説

「データベース」このページを訪れているということは、一度くらい聞いたことがあると思います。本記事では、ITエンジニアやデータサイエンティストの目線から、データベースとは何か、なぜ必要かについて解説していきます。データベースをなぜ学ぶ必要があ...