データの5つの特性、3つの難しい問題、そして1つの傲慢さ

データの5つの特性、3つの難しい問題、そして1つの傲慢さ

データとは、測定、記録、発見などを通じて得られる客観的な存在であり、物事に関する事実の記述です。データには、無限性、容易な複製、異質性、消滅性、独創性の 5 つの特性があります。データと情報は極めて重要ですが、現在、データの健全かつ秩序ある発展を阻む問題が 3 つあります。それは、データ権利の確認、データ取引、データ要素です。詳しい分析は記事で見てみましょう!

「データは新たな石油である」(Clive Humby、2006 年)。 1 つだけ選ぶとすれば、データは石油に最も似ています。どちらも世界にとって重要な戦略的資源であり、原動力です。しかし、データは単なるデータであり、それ以外の何物でもありません。

1. 5つの特徴

データとは、測定、記録、発見などを通じて得られる客観的な存在であり、物事に関する事実の記述です。データには、無限性、容易な複製、異質性、消滅性、独創性の 5 つの特性があります。

1. 無限

物理的なオブジェクトとは異なり、データは使用によって枯渇することはありません。むしろ、使用によって生成され、今後も生成され、量が増加し続けます。 「データは最も基本的な客観的製品になります。私たちが何をしても、データが生成されます」(Paul Sonderegger、2017年)。 DASA R&T の「Emerging Technology Trends 2016-2045」によると、世界中で生成される新しいデータの量はおよそ 2 年ごとに 2 倍になっています。これはビッグデータのムーアの法則とも言え、データ爆発は避けられません。

2. 複製の容易さ

データはほぼゼロのコストで迅速にコピーでき、複数の人が同時に使用でき、複数回リサイクルでき、ある人の使用が他の人の使用を排除または妨げることはなく、使用において異なる人の間で直接的な利益相反はありません。再現の容易さにより、データはある程度非競争的かつ非排他的になりますが、データは公共財ではありません。公開データ、企業データ、個人データがあります。

3. 異質性

『変装者』の中で謝若霖はこう言った。「ここには金の延べ棒が 2 本あるが、どちらが高貴で、どちらが汚いか教えてくれ。」これは真実を示しています。つまり、金の延べ棒は同質であり、2 つの金の延べ棒の価値は同じです。工場から出荷される商品や、石油や電気などのエネルギー源など、均質性は至る所に見られます。ただし、データは異種です。あるデータビットに含まれる値は、別のデータビットに含まれる値とはまったく異なり、同じデータでも人によって価値が異なります。王秦民(2023)は次のように述べています。「データの価値は、ユーザー、アプリケーション シナリオ、および専門的なデータ品質基準によって異なります。」

4. 腐りやすさ

データは時間の経過とともに急速に価値が下がる、消耗しやすい商品です。 IBM (2015) によると、非構造化データの 60% は数ミリ秒以内にその真の価値を失います。つまり、データの価値は、その適時性に大きく反映されるということです。データの半分以上は、生成された瞬間に価値がなくなります。これを「1秒の法則」と呼ぶことができます。分析や実用化に利用できるデータはさらに少なくなります。世界のデータの 90% は分析も使用もされていません (IBM、2015 年、DASA R&T、2016 年)。 2020 年に作成またはコピーされたデータのうち、2021 年に保存され保持されたのは 2% 未満でした (出典: IDC)。

5. 独創性

データは生のままであり、それ自体には意味がありません。それを加工・分析することで初めて、人々にとって有用な情報に変換することができます。データが新しい石油だとしたら、分析は内燃機関です。情報はデータ抽出の産物です。情報は人間の脳によって処理され、主観的な知識を形成します。データ、情報、知識は歴史的なものですが、知恵は未来に関するものであり、人々が知識を使って意思決定や判断を下す能力です。

データ、情報、知識、知恵の関係について、フォーダム大学のゼレニー教授 (1987) は、下から上に向かって DIKW ピラミッド モデル (下図参照) を提唱しました。

  • データ: 何も知らない、何も知らない。
  • 情報: 何であるかを知る、それが何であるかを知る;
  • 知識: 方法を知っている、やり方を知っている;
  • 知恵: 理由を知る。

図 DIKWピラミッドモデル

難しい質問が2つか3つ

個人と周囲の人々との間のギャップは、主に情報を把握し、理解し、適用する能力の違いにあります。データと情報は重要です。しかし、現在、データの健全かつ秩序ある発展を阻む難しい問題が 3 つあります。それは、データ権利の確認、データ取引、データ要素です。私たちは挑戦に立ち向かい、勇気と知恵をもって行動し、あらゆる困難を克服しなければなりません。

1. データ所有権の確認

関羽は曹の陣営にいたが、心は漢にあった。私たちにとって、肉体の所有権を決定することは比較的簡単です。しかし、心と魂は霊妙なものであり、不確実性、秘密性、多様性を持ち、同時に複数の主体に属することさえあります。データも同様です。誰の所有物なのかを明確に判断することが難しく、物理的に効果的に分割し、権利を合理的に分配することが困難です。所有権確認の複雑さは、データ自体の特性と権利者の多様性に関連しています。データ チェーンには複数の参加者が関与しており、各参加者は不可欠であり、単独では機能できず、それぞれに異なる要求があります。さらに、データの価値密度が低く、生み出される利益を明確に測定することが難しいため、データ権利確認のコストが非常に高くなります。

2. データ取引

取引は相互に利益のある行動であり、人間社会における最も自発的で前向きな活動です。取引は、双方が利益を得る場合にのみ成立します。データに関しては、トランザクションが課題となります。 UNCTAD(2019)は、「データには重要な使用(または乱用)価値があるが、ほとんどの経済商品のような交換価値はない」と指摘しています。実際の取引では、一般的に価格が明確で、繰り返し可能かつ予測可能です。たとえば、店が明確に価格設定されたミルクティーをさまざまな消費者に繰り返し販売する場合、消費者が得られるメリット(喉の渇きを癒す、おいしい、社交的な交流)は予測可能です。データは異質であり、価値の測定は難しく、価格設定は難しく、期待効用は管理が難しく、「ただ乗り」のリスクがあります...これらはすべて、データ取引で直面しなければならない問題です。

3. データ要素

生産要素とは、人々が商品やサービスを生産するために使用する基本的な資源です。生産を容易にしますが、製品やサービスの一部にはならず、生産プロセスによって大幅に変更されることもありません。新古典派の創始者であるマーシャルは、有名な著書『経済学原理』(1890年)の中で、土地、労働、資本、起業家精神という4つの生産要素理論を提唱しました。メイ・ホン院士は(2023)「データを重要な生産要素として確立することは中国の取り組みである」と指摘した。しかし、経済学におけるデータ生産要因を定義することは困難な作業であり、影響力のある説得力のある結果は未だ見られません。経済学者は早急に研究を強化する必要がある。

3. ビッグデータに対する傲慢さを避ける

データマイニングの典型的な事例といえば、多くの人が「ビールとおむつ」や Google Flu Trends を思い浮かべるでしょう。実際、前者は 1992 年にはすでに登場していた話ですが、実際には起こりませんでした。後者はインフルエンザの到来を事前に予測したが、精度が低すぎたため後に廃止された。

データの重要性は疑う余地がありません。人々は、その驚異性を強調するために、「データ」の前に「ビッグ」という言葉を付け加えることを好みます。また、人々は「ビッグデータへの傲慢さ」という誤解に陥ることもよくあります。データは多くの問題を解決できますが、限界があり、データを通じて突然変異を予測することは困難です。平和な生活を送る豚は、過去のデータに基づいて春節のブラックスワンを予測することはできません。馬車の走行データによって「より速い馬」を手に入れることはできるが、車を発明することはできない。データは企業にとって競争上の優位性となりますが、万能ではありません。優れたアプリは、履歴データがあるからといって、ただ座って安心することはできません。革新者たちによって常に挑戦されており、「人気を維持できるのはほんの数年だけ」です。起業家はデータや蓄積がなくても、革新的な製品を発売し、ユーザーを獲得し、成功を収めることができます。この観点からすると、データが全く存在しないということはあり得ないことではありません。

ビッグデータの時代においては、「因果関係ではなく相関関係」が指針とされています。 「重要なのは、分析的推論を使って、なぜ 2 つのものが同時に、または連続して現れるのかを解明することです。理由が正しい場合にのみ、新しい知識または新しく発見された法則と見なすことができます。相関関係自体にはあまり価値がありません」(Li Guojie、2015 年)。 「数字」だけを信じるよりも、「数字」を持たないほうが良いです。貴重な情報や結論を引き出すためには、実験観察、論理的演繹、帰納、洗練などの科学的手法を総合的に活用して、物事の関係性や法則を探究する必要があります。

私たちがデータを重視するのは、データ自体が重要だからではなく、客観的な世界と客観的な法則を尊重し、事実から真実を追求する精神が重要だからです。データは事実です。李国傑院士(2015)は次のように述べています。「データを重視するということは、事実に基づいて話し、合理的思考に従うという科学的精神を強調することを意味します。」

著者: Yan Deli; WeChat 公開アカウント:「Tencent Research Institute (ID: cyberlawrc)」

<<:  あなたの思考能力はどのレベルですか?

>>:  ブランドと価格が生死を決める

推薦する

HACCP認証のための重要管理点の設置の適切性と妥当性

重要管理点 ( CCP ) とは何ですか?これは 2 つのレベルで理解できます。第 1 に、食品生...

Amazon ビデオ広告を設定するにはどうすればいいですか?広告を再生するにはどうすればいいですか?

動画広告は、印刷広告に比べて、ダイナミックな画像とサウンドにより魅力的で、効果も間違いなく優れている...

10月の新たなトップストリーマー:一夜にして人気が爆発し、その後一瞬で崩壊

この記事では、Douyinのトップストリーマーの変遷から始めて、Yu Wenliangの没落とGua...

450分の大作は5日間で再生回数1億回を突破した。 Tik Tokでは長い動画が人気になってきているのでしょうか?

広東省出身のカップルのDouyinフォロワー数の増加傾向は6月に大幅に鈍化した。ライブ配信による物販...

越境電子商取引プラットフォームとは何ですか?プラットフォームの選択方法は?

現在、海外でビジネスを展開したい商人は、越境ECプラットフォームを探すのが一般的です。しかし、海外の...

Xiaohongshu で 1 日に 1,000 人以上の顧客を引き付けるにはどうすればよいでしょうか?

この記事では、Xiaohongshu のトラフィック生成と収益化について包括的かつ体系的な分析と概要...

若者たちは喧騒の中にある「生命の精神」を味わうために市場に集まる

本稿では、市場に集まる若者たちから出発して、この現実的な「スピリチュアルマッサージ」を分析します。大...

Amazon は税金をどのように処理しますか?税金還付を申請するには?

越境電子商取引の繁栄が進む中、世界最大級の電子商取引プラットフォームの一つであるアマゾンは、多くの販...

Shopeeレビュー特典を設定するにはどうすればいいですか?どうやって管理するの?

Shopeeで商品を購入するユーザーの中には、コメントを残す習慣がない人もいます。たとえお店の商品が...

シナリオはブランドの新たな成長を生み出す

著者は、シナリオブランドに関するこれまでの8つの記事をまとめ、シナリオブランド5S成長モデルの事例を...

東南アジア市場における越境電子商取引プラットフォームとは何ですか?東南アジア越境ECプラットフォームの概要

東南アジア市場における越境電子商取引プラットフォームは近年急速に成長している新興産業であり、同地域の...

ISO 9001:2015 プロセスアプローチ

プロセスアプローチとは何ですか?望ましい結果を達成するためのプロセスとその相互作用の体系的な管理。組...

おもちゃを購入する際は3C認証マークをご確認ください

現在の国際的な産業界では、企業に対して高品質かつ低コストの製品を提供することが求められるだけでなく、...

依然として製品機能のアップグレードにこだわり、ヒット商品を生み出すのは難しい

どのような分野であっても、新しい消費者ブランドは常に永遠の話題です。では、新たな消費とは一体何なので...