これは私が今まで見た中で最も正確な予測モデルです。

これは私が今まで見た中で最も正確な予測モデルです。

この記事では、予測アルゴリズムの本質と要点から始めて、業務運営を利用して予測誤差を回避する、基本的な分析を利用して予測範囲を狭める、長期予測ではなくローリング予測を利用する、買い残しモデルを利用して自分自身を守る、予測問題をより深く調べるという 5 つの予測方法を提案します。この記事はデータアナリストに読むことをお勧めします。

「不正確な予測!」データ分析の分野における究極の問題です。予測アルゴリズムは数多く存在しますが、現実に直面すると、基本的に粉々に打ち砕かれ、ビジネス側は決して満足しません。行き詰まりを打破するにはどうすればいいでしょうか?

1. 予測アルゴリズムの性質

基本的に、予測アルゴリズムには 2 つのカテゴリしかありません。

1. 時系列ベース

  • 平滑化: 比較的安定したデータの場合
  • 自己回帰: 増加傾向または減少傾向のデータに使用される
  • 季節要因による自己回帰:周期的な変動があるデータに使用

2. 因果関係に基づく

  • 2 つのカテゴリの問題: 将来 XX は起こるでしょうか?典型的な例はLRです。
  • 多重分類問題: 将来は次のどれになるでしょうか? A、B、それともC?典型的な例は決定木です。
  • 継続的な問題: 将来の価値は何ですか?典型的な例としては線形回帰が挙げられます。

モデリング時に、すべての問題を解決するために 1 つのモデルが使用されるのではなく、2 段階のモデリングが使用される可能性があります。たとえば、顧客グループの消費を予測するには、バイナリ分類モデルを使用して消費するかどうかを予測し、次に連続モデルを使用して消費量を予測します。このように、消費するユーザーの数と予測消費量を掛け合わせることで、総消費量を求めることができます。これは典型的なアプローチです。

これは本が教えることですが、現実に直面するとそれが粉々に打ち砕かれるのはなぜでしょうか?

2. 予測アルゴリズムのポイント

理由: モデルの効果を強調するために、本書では質が高く完全なデータを持つデータセットを意図的に選択しました。

現実には、問題は尽きることがありません。

1. データなし

多くの場合、予測されるデータは「月間総消費量」の 1 行のみで、他のデータはまったくありません...

2. まだデータなし

多くの企業は、Tmall、Douyin、Amazon から直接データを取得できず、バックエンドからエクスポートされたわずかなデータを使用して操作することしかできません...

3. データがない

ほとんどの企業はTouteng’aのような独占企業ではなく、非常に一方的なデータしか持っていません。一般的に、ほとんどの企業はお金を支払うことでユーザーを引き付けます。ユーザーは携帯電話番号と割引注文のみを持っています...

これにより、面白い状況が発生します。多くの企業が因果モデルを使用する場合、最も大きな影響を与える変数はプロモーションの強度である必要があります。ステップワイズ回帰法を使用してモデルを構築する場合でも、プロモーションの強度の変数によって他のすべての変数を直接排除できます。予測結果は、プロモーションが強力であればあるほど、より多くのユーザーが参加し、より多くの購入が行われるということになります。

このような結果が出たら、企業は間違いなくこうコメントするでしょう。「それは全部でたらめだ、ずっと前からわかっていたことだ!」

これが現実の 2 番目に大きな問題です。つまり、ビジネスの結果をどのように測定するかということです。

例えば、予測販売数量が1000万

  • 事業が 900 万に達すると、予測がまったく正確ではなく、商品のバックログが発生すると言われます。
  • ビジネスが1100万に達したとき、私は言うだろう:予測はまったく正確ではない、私はまだ最高だ

つまり、あなたが 100% 正確でない限り、彼はあなたを責める理由を持つことになります。横方向に繰り返しジャンプすることもできます。たとえば、「ビジネスは目標を達成できたはずでした。予測でそれが可能だとわかったので、いくらかのお金を節約しました。しかし、結局、目標は達成できませんでした。すべては予測がビジネス判断を妨げたためです...」

行き詰まりを打破するにはどうすればいいでしょうか?問題は人間から発生するので、人間が解決しなければなりません。問題を解決する鍵は、ギャンブル的な予測を避け、ビジネス シナリオの観点から人間の影響を排除することです。

3. 業務運営を通じて予測エラーを回避する

シナリオによっては、ビジネス運営を通じて問題を直接排除できる場合もあります。現時点では、モデリングせずにビジネスメソッドを直接使用します。

例えば:

  • シナリオ 1: 「売上データが非常に少なく、分散しています。売上をどのように予測しますか? 商品自体は保管中に耐久性がないため、購入しすぎると在庫損失率が非常に高くなります」 - グループ購入を活用しましょう。共同購入がこの課題の解決策です。
  • シナリオ 2: 「販売データが非常に少なく、価格弾力性を計算するのは不可能ですが、ビジネス側は価格弾力性を予測して収益を増やしたい」 - オークションを活用しましょう。オークションはそのためにあるのです。
  • シナリオ 3: 「新製品はまったく新しいモデルで、データがありません。どうやって予測すればいいのでしょうか?」 - 新商品の先行販売/ファン購入をQRコードで行います。それが飢餓マーケティングの目的です。
  • シナリオ 4: 「プロモーション期間中の在庫をどのように予測すればよいですか? ユーザーからの需要がどの程度あるかわかりません。」 - 10元のデポジット、デポジットバウチャーの3倍、それがその効果です

Xiaomi から Tmall、Pinduoduo に至るまで、ほぼすべてのインターネット マーケティング モデルは、実際にはデータ不足による在庫切れの問題と戦っています。したがって、他の人のモデルに注目するだけでなく、彼らの運用からも学びましょう。

4. ファンダメンタル分析を使用して予測範囲を絞り込む

人生ギャンブルの予測にはすべて共通点があります。それは、予測が正確であるためには、高すぎても低すぎてもいけないということです。たとえば、一般的な販売実績予測では、実際の販売実績が 1,000 万の場合、正確であるためには予測も 1,000 万である必要があります。これが、モデルが「不正確」と評価される問題の根本的な原因です。

ビジネス シナリオに戻ると、実際のところ、ほとんどのビジネス シナリオではこのレベルの精度は必要ありません。多くの場合、企業は突然の急増を恐れています。予測目標は「100%正確」と設定するのではなく、「急激な増加・減少が事業の吸収能力を超えているかどうか」と設定する方がよいでしょう。

基本的に 100% 正確な予測をすることは不可能ですが、急激な上昇/下降が起こりそうな場所を見つけるのは簡単です。基礎分析により不安定要因を判別することで、予測問題の難易度を大幅に低減することができます(下図参照)。

基礎分析をしっかり行い、不安定な要素を分解すると、モデルの組み合わせを選択して問題を解決することが容易になります (以下を参照)。

5. 長期予測ではなくローリング予測を使用する

人生を賭けた予測はすべて、非常に長い予測期間を持ちます。最長で 1 年、最短で 1 か月になることもあります。ギャンブルのプロセスには時間がかかりすぎ、初期段階で収集できるデータは非常に少なく、ビジネス部門のさまざまな中間操作を反映できないため、プロセスは非常に受動的です。

ローリング予測を使用すると、この欠点をかなり補うことができます。日次・週次ローリング予測により、不足データを補完できるだけでなく、業務側による一時的な調整の影響も反映でき、一石二鳥の効果が得られます(下図参照)。

6. 購入して放置するモデルで自分を守る

適切な質問と継続的な予測により、基本的に実際の作業ニーズを満たすことができます。しかし、予測者であれば、自分自身を守り、ビジネス側が繰り返しミスを犯したり、責任を転嫁したりすることを避ける方法を学ばなければなりません。

買って放置する方法は良い方法です。予測結果が示されると取引は成立し、関係するすべてのビジネス関係者は予測結果に疑問を抱くことはなくなり、予測結果に基づいて追加を行うようになります。

予測が短すぎると感じた人は、追加商品の要求書を作成し、書面による証拠を残すことができます。その時には、予測が不正確だったのか、それとも企業が多すぎる量を申請したために販売できなかったのかが明らかになります (下の図を参照)。

7. 予測問題の詳細

予測の問題の背後には、より深刻なビジネス上の問題があります。多くの企業では、在庫の遅れによる損失が直接目に見えて現れ、倉庫内で商品が腐ってしまいます。しかし、在庫切れによる潜在的な売上損失は真剣に考慮されていません。在庫切れによる損失を計算するのは簡単です。予約をする際には顧客に前金の支払いを依頼することができ、また需要量や時間を登録することもできます。しかし、多くの企業は怠惰であったり、愚かであったり、責任を取りたがらなかったりします。つまり、彼らはそれをしないのです。

予約販売、共同購入、ハンガーマーケティング、デポジットインフレ、在庫切れ登録…すべてのビジネス手法には、運用能力だけでなくシステム構築のサポートが必要です。明らかに、ビジネスにとっては、こうしたシステム構築や複雑な運用方法に取り組むよりも、「不正確なモデル予測」を直接非難する方が簡単です。したがって、企業に直接予測のニーズについて尋ねると、「高すぎず、低すぎず、ちょうどいい」というギャンブル的な予測をする傾向があります。

しかし、これは明らかにデータアナリストにとって不公平です。潜在的な損失は測定できないため、実際のバックログは直感的に確認できます。したがって、データアナリストとして、バックログ損失に対処することで貢献することができます。だからこそ、さまざまな操作方法があるのです。

著者: 地に足のついた教師チェン

出典:WeChat公開アカウント「地味な陳先生(ID:gh_abf29df6ada8)」

<<:  LVはヨガ界で人気を失ってしまったのでしょうか?二極化した消費者市場において、「低価格」だけが唯一のルールなのでしょうか?

>>:  2023年小紅書母子トラックの7つのホットコンテンツテーマトレンドがここにあります!

推薦する

短編動画で故郷を探す若者たち

農業、農村地域、農家に関する動画が、新しい形で短編動画プラットフォームに登場しています。農業、農村、...

Lazadaの平均注文額は高いですか?どうやってお金を稼ぐのか?

オンラインストアを運営している皆さんは、平均注文額を知っておくべきだと思います。例えば、Pinduo...

Amazon中国の公式サイトの入り口はどこですか?まだ店を開けてもいいですか?

Amazon でストアを開設するプロセスは、実はとても簡単です。ストアを開設するために必要な営業許可...

特技の交換が流行、Tik Tok SNS は健在か?

特技の交流が新たなブームを巻き起こし、Tik Tokはソーシャルアクティビティの新たな人気者となった...

顔を見せずにファッションブロガーになりませんか? 1枚の写真や記事で1万元以上稼いだ

「顔を出さないファッションブロガーたちは、収益を得るための新たな方法を模索している。」セルフメディア...

Shopeeサブアカウントとは何ですか?何の役に立つの?

Shopee プラットフォームは、いくつかの新しいサービスと新機能を開始します。販売者の友人の中には...

Shopee Philippinesはいかがでしょうか?フィリピンのサイトにはどんなカテゴリーがありますか?

Shopeeは現在8つのサイトを開設しており、その中で台湾サイトとインドネシアサイトが最大規模となっ...

Cha Yan Yue Se は Ba Wang Cha Ji に追い抜かれました。ボトルネックはどこですか?

本稿では、中国の新茶ブランド「茶園月色」の発展の軌跡から始め、最近台頭してきたブランド「八王茶記」と...

ホットスポットと洗練されたマーケティングは、永埔、小関茶業、元啓森林にとって目立つための魔法の武器となるのでしょうか?

ブランドは、ホットな話題と組み合わせることで世間の関心と注目を集めることができ、それによってブランド...

コーディングするだけ!ユーザーポートレートを作成するときに最も重要な質問は次の 5 つです。

市場競争は熾烈かつ残酷です。企業をどのように位置づけ、製品プロジェクトを確立し、ユーザーポートレート...

社会的責任コンプライアンス監査チェックリスト(III)

カルフール工場名: XX 大成玩具株式会社によって準備された:プラCD部門/オフィス:プラスチック製...

Amazonで画像のURLを取得するにはどうすればいいですか?

Amazon で商品を販売する場合、高品質の商品画像は顧客を引き付ける鍵の 1 つです。では、Ama...

タオバオが海外市場への「新ルート」を開拓、一部の衣料品販売者は週に20万元の追加収入を得ている

タオバオは衣料品の全世界送料無料プランを開始し、衣料品販売業者が海外に進出するための「新たなルート」...

何百万人もの人々が、賑やかな生活を楽しむためにチェックインします。ライブ配信+屋台の設置は新しいビジネスになるのでしょうか?

夜市の屋台のライブ中継を見たことがありますか?背景に行き交う人々は、私たちの周りの道端の屋台です。ネ...

Shopee チャット放送には料金がかかりますか? よくある質問は何ですか?

Shopeeプラットフォームでは、多くの初心者販売者はチャットブロードキャストの役割をあまり理解して...