Data cleansing หรือ data cleaning หรือ data scrubbing หมายถึง การทำความสะอาดข้อมูล เป็นกระบวนการตรวจสอบและการแก้ไข (หรือลบ) รายการข้อมูลที่ไม่ถูกต้องออกไปจากชุดข้อมูล ตารางหรือฐานข้อมูล ซึ่งเป็นหลักสำคัญของฐานข้อมูล เพราะหมายถึงความไม่สมบูรณ์ ความไม่ถูกต้อง ความไม่สัมพันธ์กับข้อมูลอื่นๆ เป็นต้น จึงต้องมีการแทนที่ การปรับปรุง หรือการลบข้อมูลที่ไม่ถูกต้องเหล่านี้ออกไป เพื่อให้ข้อมูลมีคุณภาพ

การทำความสะอาดข้อมูล เกิดขึ้นเนื่องจาก มีความไม่สอดคล้องของข้อมูล ซึ่งอาจเกิดจากข้อผิดพลาดของการบันทึกข้อมูล การส่งข้อมูล หรือการให้ความหมายของข้อมูลที่จัดเก็บแตกต่างกัน ยิ่งต้องมีการบูรณาการกับฐานข้อมูลอื่นๆ เช่น คลังข้อมูล หรือหลายฐานข้อมูล จึงมีโอกาสสูงที่จะเกิด "ข้อมูลที่ไม่สะอาด" ขึ้น
 

{pdf=http://stks.or.th/th/attachments/article/3182/20120818-Data-Cleasing.pdf|800|900}

biotec

mtec

nectec
nanotec
entec

tsp

AIMI

nctc

ตราโลโก้ ศูนย์เทคโนโลยีเพื่อความมั่นคงของประเทศและการประยุกต์เชิงพาณิชย์ (Logo of National Security and Dual-Use Technology Center: NSD)

ตราโลโก้ ศูนย์ทดสอบทางพิษวิทยาและชีววิทยา (Toxicology and Bio Evaluation Service Center)

 
สำนักงานพัฒนาวิทยาศาสตร์และเทคโนโลยีแห่งชาติ (สวทช.)
เป็นหน่วยงานของรัฐที่จัดตั้งขึ้นเพื่อศึกษาวิจัยและพัฒนาทางด้านวิทยาศาสตร์ และเทคโนโลยีเพื่อการพัฒนาประเทศไทย ไม่ได้มีวัตถุประสงค์เพื่อแสวงหากำไร
หากท่านพบว่ามีข้อมูลใดๆ ที่ละเมิดทรัพย์สินทางปัญญาปรากฏอยู่ในเว็บไซต์ของสำนักงานพัฒนาวิทยาศาสตร์และเทคโนโลยีแห่งชาติ
โปรดแจ้งให้ทราบเพื่อดำเนินการแก้ปัญหาดังกล่าวโดยเร็วที่สุดต่อไป