Adrien Auzoutの「A TABLE of the Apertures of Object-Glasses」(『Philosophical Transactions』の1665年の記事より)
データ、情報、知識、知恵は密接に関連する概念ですが、それぞれが他のものとの関係で独自の役割を持ち、それぞれの用語には独自の意味があります。 一般的には、データは収集して分析するものであり、何らかの形で分析されて初めて意思決定に適した情報になると考えられています。 あるデータが誰かにとって有益なものであるかどうかは、その人がどれだけ予想外のことをしたかにかかっていると言えるだろう。
知識とは、ある対象についての情報を扱った豊富な経験に基づく理解のことです。 例えば、エベレストの高さは一般的にデータと考えられています。 高度計を使って正確に測り、データベースに登録することができます。 このデータは、エベレストに関する他のデータと一緒に本に収録され、エベレストに登るための最良の方法を決定するのに役立つようにエベレストを説明することができる。 登山の経験に基づいて、エベレストの頂上に到達する方法をアドバイスできるような理解は、「知識」と言えるかもしれません。 そして、その知識に基づいてエベレストの山頂を実践的に登ることが「知恵」と言えるでしょう。 言い換えれば、知恵とは、良い結果が得られるような状況で、その人の知識を実際に適用することを意味します。
データは最も抽象度の低い概念、情報はその次に低い概念、そして知識は最も抽象度の高い概念と考えられています。 例えば、エベレストの高さは一般的に「データ」、エベレストの地質に関する本は「情報」、エベレストの頂上に到達するための実用的な情報が掲載された登山ガイドブックは「知識」と考えられています。 “情報」には、日常的なものから専門的なものまで、さまざまな意味がある。 しかし、この考え方は、情報からデータが生まれ、知識から情報が生まれることを逆手に取っているとも言われています。 一般に、情報という概念は、制約、コミュニケーション、コントロール、データ、フォーム、インストラクション、知識、意味、精神的刺激、パターン、知覚、表現などの概念と密接に関連している。
計算機や機械が発達する以前は、人が手作業でデータを収集し、それにパターンを付与しなければなりませんでした。
コンピュータや機械が発達する前は、人の手でデータを収集し、それをパターン化する必要がありました。 2010年代に入ってからは、マーケティングや市民の社会サービス利用状況の分析、科学研究など、さまざまな分野でコンピュータがデータを収集し、整理・加工することが広く行われています。 このようなデータのパターンは、知識を深めるための情報と考えられます。 これらのパターンは、「真実」として解釈されることもあり(ただし、「真実」は主観的な概念であることもある)、分野や文化によっては美的・倫理的な基準として認定されることもある。 物理的または仮想的な痕跡を残す出来事は、データによって遡ることができます。
機械的なコンピューティングデバイスは、データを表現する手段によって分類されます。 アナログコンピュータは、データを電圧、距離、位置などの物理量で表します。 デジタルコンピュータは、データを一定のアルファベットからなる記号の列として表現する。 最も一般的なデジタルコンピューターは、2進法のアルファベットを使用している。 数字や文字などの身近な表現は、この2進法のアルファベットから構成されます。 データにはいくつかの特殊な形式がある。 コンピュータ・プログラムは、命令として解釈できるデータの集まりである。 ほとんどのコンピュータ言語では、プログラムと、プログラムが操作するその他のデータとを区別しているが、Lispなどの一部の言語では、プログラムは基本的にその他のデータと区別されない。 また、他のデータの記述であるメタデータを区別することも有用である。 メタデータの前段階の用語として、”アンシラリーデータ “がありますが、これと似ています。 メタデータの典型的な例は、書籍の内容を記述した図書館のカタログです。