新入生からよく「データ分析の完全なプロセスとは何ですか?」という質問を受けます。今日は、データ分析のプロセス全体を理解できるように、簡単な例を使用します。比較することで、完全なデータ分析が行われていないと感じる理由もわかります。 ある日、あなたの友人の王老があなたに言いました。「なぜまだ仕事に行くんだ?月に1万元しか稼げないのに。私のようにネギパンケーキを売ったほうがいいよ。仕事よりずっと稼げるよ!」あなたは驚き、好奇心を抱きました。ネギパンケーキを売ると本当に仕事をするよりも儲かるのでしょうか?この質問に答えるには、分析を行う必要があります。以前、Lao Wang があなたに言ったことは、専門的には「分析の背景を理解する」と呼ばれています。 では、ネギパンケーキを売るのと仕事をするのとでは、どちらがより多くの収入を得られるかをどのように判断するのでしょうか?直感的にこう思うかもしれません。「働いて月にいくら稼げるかは明らかだが、ネギパンケーキを売って月にいくら稼げるかは明らかではない。」そこで、下図のような比較表を作成し、データの収集を始めました。このアクションは、専門用語では「分析対象の決定」と呼ばれます。 手打ちパンケーキの屋台は小さいですが、雑貨がたくさん売られています。
一つ一つ数えるのは面倒だし難しいです。 したがって、物事を簡素化し、最も重要なコストと収益に焦点を当てることにしました。 Lao Wang の屋台に行って、次の重要な情報を入手します。 1. 最も基本的なオリジナル味の手延べパンケーキ:パンケーキ1枚+卵1個、5元 2. ソースと刻みネギはちょっとした出費です。主な費用はパンケーキ、卵、天然ガスです。 3. ハムソーセージは0.2元で仕入れて2元で販売し、チキンフィレは0.3元で仕入れて3元で販売し、大きな利益を上げることができます。 4. その他の断片は単なる断片ですが、何もないよりはましです。 そこで、次のロジック図とデータ テーブルを作成します。このステップは、専門用語では分析モデルの構築と呼ばれます。 これを実行したら、データの収集を開始できます。 1. お支払いはWeChatとAlipayで行いますので、当日に受け取った金額を直接確認できます。 2. 消費したビスケット、卵、ハムソーセージ、チキンフィレは、朝と夕方に 1 回ずつカウントできます。 3. ガス消費量は日単位で計算できません。ガスを2回交換するのに何日かかるかを計算して割り当てることしかできません。 このプロセスは、専門用語ではデータ収集と呼ばれます。収集プロセス中は、いくつかの問題を排除することに注意を払う必要があります。例えば、夜に麻雀をして1,000元を失った場合、これは屋台とは関係がないので、WeChatの収支から除外する必要があります。これをデータクリーニングと呼びます。 詳細データを収集した後、次の表に示すように、毎日の収入と支出を計算できます。このプロセスは、データ計算(一般にデータ取得とも呼ばれます)と呼ばれます。データ取得の複雑さは、データ計算の複雑さに直接関係します。データが上記のように単純であれば、作業は間違いなくはるかに簡単になります。 「お茶一杯、タバコ一本、そして一日で書くべき SQL 1 行」という詩があります。これは、データ計算が複雑すぎるために、何百行もの SQL を書かなければならないことを嘆いています。 データを見た後、あなたは疑問に思うでしょう。なぜラオ・ワンの収入はこんなに不安定なのでしょうか?ある日は高く、ある日は低く。毎日の詳細を理解すると、次のことがわかります。 1. 雨の日は人通りが少なくなり、収入が減る(外的要因) 2. 今日は遅く起きて、いい席が取れず、収入が減った(内的要因) 3. 今日は熱があって体調が悪かったので、夜9時までしか働かず早めに閉店したため、収入が減った(内部要因) これらの理由を記録しなければ、詳細な分析を行うことは不可能であると思われます。そこで、下の図に示すように、Lao Wang の内部要因と外部要因を毎日記録しました。このアクションは、分析ディメンションの追加 (一般にラベル付けとも呼ばれます) と呼ばれます。 分析的な側面から、Lao Wang の収入が不安定な理由を説明でき、一定の予測能力を持つことができます。たとえば、天気予報を見て今月は2週間雨が降ると予想されていたら、王さんは間違いなく収入を失うことになります。 上記の情報をすべて組み合わせると、1 か月後、下図に示すように、最初にリストした分析目標がようやく達成されました。 全体的に見ると、統計月では Lao Wang の給与は確かにあなたの給与よりも高いようです。しかし、慎重に分析すると、Lao Wang の収入変動に影響を与える要因がわかり、判断に新たな側面が加わる可能性があります。例えば: 1. 月に 28 日間屋台を出し続けることはできますか? 2. 良い席を確保するために午前 6 時に起きることはできますか? 3. 熱があっても午後9時まで我慢できますか? このプロセスは、専門用語では「評価基準の追加」と呼ばれます。 最終的に、屋台を出店することによる収入は高いものの、体力的に負担が大きすぎて安定性に欠けるという結論に達し、屋台を出すという提案を拒否します。これを「分析的結論を導き出す」といいます。 上記がデータ分析の全プロセスです。 1. 分析の背景を理解する 2. 分析目的を明確にする 3. 分析モデルを構築する 4. データの収集、クリーニング、計算 5. 分析ディメンションと評価基準を追加する 6. 結論と提案を導き出す 多くの学生が完全な分析を行っていないと感じる一般的な理由は次のとおりです。
著者:陳実直先生、出典:WeChat公式アカウント「陳実直先生」 |
<<: Xiaohongshu には人気のある記事がたくさんありますが、コンバージョンにはつながりません。行き詰まりを打破するにはどうすればいいでしょうか?
>>: 小紅書、ビデオアカウント、Douyinトラフィックアルゴリズムメカニズム、収集することをお勧めします!
多くの人がTaobao、JD.com、Pinduoduoなどの国内電子商取引プラットフォームで商品を...
アマゾンは、2040年までにネットカーボンニュートラルを達成するという目標を発表した最初の大手企業と...
BSCIの賃金に対する姿勢2009 年 11 月 2009 年 10 月、アジアの衣料品労働者の最低...
HACCPシステム認証とその適用基準: 4. 適正製造規範(GMP) 1. すべての種類の食品に対...
Amazon に出店する商人は、基本的に店舗の重要なデータ指標を確認します。これらのデータ指標は、店...
自分のビジネスを始めたい場合、多くの人が電子商取引を検討するでしょう。ご存知のように、国内の電子商取...
Amazon の広告は手動広告と自動広告の 2 種類に分かれており、これら 2 種類の広告にはそれぞ...
GRS認証の期待される結果:申告されたリサイクル材料は、入力から最終製品まで、完全かつ検証済みの保管...
TikTokプラットフォームは最近、偽造品や粗悪品の販売に対して厳しい姿勢をとる新たな規制を導入し...
東南アジア最大級のオンラインショッピングサイトの一つであるLazadaは、数え切れないほどのeコマー...
競争の激しいビジネス環境において、多くの経営者や起業家はパフォーマンスのボトルネックを打破する方法を...
オンラインショッピングの人気が高まるにつれ、迅速な配送サービスに対する期待が高まっています。この記事...
最近、Amazon にストアを開設する業者が増えています。Amazon ストアを開設した後は、プロモ...
急速に変化するデジタル時代において、私たち一人ひとりはある程度データを扱っています。データは単なる数...
Shopee は東南アジア最大の越境電子商取引プラットフォームの 1 つであり、消費者に豊富で多様な...