数据原则 | 原创,AI翻译
-
确保原始数据是正确的。
-
修正根数据而不是生成数据。
-
使用大量的检查脚本来确保数据准确性。
-
检查数据的正确性和一致性。
-
有些数据需要完全准确,而其他数据可以大致正确。例如,翻译即使含有偶尔的打字错误也是可以接受的。
-
使用量化指标来衡量数据质量。
-
错误的数据会导致更多错误的数据。
-
数据包括数字、字符串、文本、数据结构、图像、视频、代码、文件和其他信息类型。
-
在物理学、科学和计算机科学的实验中保留原始数据。
-
数据应可重复生成和可重复。