ชุดข้อมูลที่มีคุณค่าสูง(High Value Datasets) มาจากการนำข้อมูลเปิดทุกประเภทที่มีลักษณะตามเกณฑ์ที่กำหนดไว้มานำเสนอบนเว็บไซต์ศูนย์กลางข้อมูลเปิดภาครัฐ โดยชุดข้อมูลที่มีคุณค่าสูงสามารถนำไปต่อยอดพัฒนาประเทศได้ โดยมีลักษณะเด่นเฉพาะ และสามารถนำไปใช้ประโยชน์ในมิติต่าง ๆ ได้มากกว่าข้อมูลเปิดทั่วไป เช่น
- เป็นข้อมูลที่สามารถเพิ่มความโปร่งใสของรัฐบาลได้
- เป็นข้อมูลที่มีความต้องการสูง
- เป็นข้อมูลที่สามารถนำไปใช้ประโยชน์ได้มาก
การพิจารณาชุดข้อมูลที่มีคุณค่าสูง แนวทางพื้นฐานในการประเมินคุณค่าของข้อมูลสามารถพิจารณาได้จาก 2 มุมมอง โดยแบ่งออกเป็นมุมมองของผู้ให้ข้อมูล และมุมมองของผู้ใช้ข้อมูล
สำหรับแนวทางในการพิจารณาชุดข้อมูลที่หน่วยงานต้องการเปิดเผยว่าชุดข้อมูลนั้นเป็นชุดข้อมูลที่มีคุณค่าสูงหรือไม่ อ้างอิงจาก High Value Datasets Quick Guide (https://data.go.th/pages/high-value-criteria) มี 10 ข้อ ประกอบไปด้วย
ส่วนที่ 1 : เพิ่มความโปร่งใส
ข้อ 1 ข้อมูลที่เปิดเผยช่วยเพิ่มประสิทธิภาพและสอดคล้องตามแผนยุทธศาสตร์ชาติหรือไม่?
ส่วนที่ 2 : ข้อมูลตามภารกิจของหน่วยงาน
ข้อ 2 ข้อมูลที่เปิดเผยเป็นข้อมูลตามภารกิจหรือทิศทางเชิงกลยุทธ์ของหน่วยงาน และมีการปรับปรุงอย่างต่อเนื่องหรือไม่?
ส่วนที่ 3 : มาตรฐานข้อมูลเปิดภาครัฐ
คำถามข้อที่ 3-7 อ้างอิงตามแนวทางการเปิดเผยข้อมูลเปิดภาครัฐในรูปแบบดิจิทัลต่อสาธารณะ เป็นไปตามที่คณะกรรมการพัฒนารัฐบาลดิจิทัลกำหนดไว้ใน พ.ร.บ. การบริหารงานและการให้บริการภาครัฐผ่านระบบดิจิทัล พ.ศ. 2562 มาตรา 17
ข้อ 3 กระบวนการเปิดเผยข้อมูลของหน่วยงานของรัฐ จัดอยู่ในระดับใดของการวัดการเปิดเผยข้อมูลเปิดภาครัฐที่สอดคล้องตามแนวทางฯ และสูงกว่าระดับที่ 3 ขึ้นไปหรือไม่?
- ระดับ 1: Initial หมายถึง ไม่มีกระบวนการเปิดเผยข้อมูลเปิดภาครัฐ หรือกระบวนการถูกกำหนดขึ้นมาเฉพาะกิจ ทำให้ไม่มีรูปแบบของการดำเนินงานที่สะท้อนภาพรวมของหน่วยงานของรัฐ
- ระดับ 2: Repeatable หมายถึง เริ่มมีกำหนดกระบวนการ สามารถดำเนินการตามกระบวนการซ้ำ ๆ ได้ แต่ยังขาดการกำหนดมาตรฐานของกระบวนการ
- ระดับ 3: Defined หมายถึง กระบวนการถูกกำหนดเป็นมาตรฐานที่สอดคล้องกับแนวปฏิบัติที่ดี ทั้งจากภายในและภายนอกหน่วยงานของรัฐ มีการถ่ายทอดองค์ความรู้หรือแนวปฏิบัติที่ดีให้กับบุคลากร แต่ยังขาดการนำไปใช้อย่างกว้างขวาง
- ระดับ 4: Managed หมายถึง มีการนำกระบวนการที่ถูกกำหนดให้เป็นมาตรฐานมาใช้ในหน่วยงานของรัฐอย่างกว้างขวาง มีการติดตามการดำเนินงานและกำหนดตัวชี้วัด
- ระดับ 5: Optimized หมายถึง มีการปรับปรุงกระบวนการเปิดเผยข้อมูลเปิดเพื่อเพิ่มประสิทธิภาพในการเปิดเผยข้อมูลภายในหน่วยงานของรัฐ หรือกับหน่วยงานที่เกี่ยวข้อง
ข้อ 4 ข้อมูลที่เปิดเผยมี Metadata และ Data Dictionary สอดคล้องตามแนวทางฯ หรือไม่
ข้อ 5 ระดับคุณภาพของชุดข้อมูลสอดคล้องตามแนวทางฯ หรือไม่ (ชุดข้อมูลคุณภาพสูง คือ ชุดข้อมูลที่มีความถูกต้องสูง ผิดพลาดน้อยมาก รวบรวมจากแหล่งที่น่าเชื่อถือ มีความสอดคล้องต้องกัน ทันสมัย)
ข้อ 6 ข้อมูลที่เปิดเผยเป็นข้อมูลที่มีกลุ่มผู้ใช้งานแสดงความประสงค์ในการนำไปใช้อย่างสม่ำเสมอภายในระยะเวลา 1 ปี หรือไม่
ข้อ 7 ข้อมูลที่เปิดเผยเป็นข้อมูลที่สามารถนำไปต่อยอด ช่วยให้เกิดการวิเคราะห์เรื่องใหม่ ๆ หรือนำไปใช้วิเคราะห์ข้อมูลเชิงลึก หรือนำไปสู่การสร้างนวัตกรรมเพื่อให้บริการประชาชนได้หรือไม่
ส่วนที่ 4 : ข้อมูลอยู่ในรูปแบบพร้อมจะเปิดเผย
ข้อ 8 ข้อมูลที่เปิดเผยอยู่ในรูปแบบที่สอดคล้องตามแนวทางฯ กำหนดในระดับใด และสูงกว่าระดับ Machine-readable (ระดับ 2 ขึ้นไป) หรือไม่ ((OL – Open License) (RE – Machine Readable) (OF – Open Format) (URI – Uniform Resource Identifier) (LD – Linked Data))
- OL: เปิดเผยข้อมูลบนเว็บไซต์ได้ทุกรูปแบบ และสามารถนำข้อมูลไปใช้ประโยชน์ได้โดยไม่ต้องขออนุญาตจากหน่วยงานของรัฐ ซึ่งรูปแบบนี้สามารถสร้างได้ง่าย แต่นำข้อมูลไปต่อยอดใช้ประโยชน์ได้ยาก (Not Reusable) เช่น PDF, TIFF, JPEG
- OL RE: เปิดเผยข้อมูลในรูปแบบที่อ่านได้ด้วยเครื่อง เป็นข้อมูลที่มีโครงสร้าง (Structured Data) และใช้กับซอฟต์แวร์จำกัดสิทธิ์ (Proprietary Software) เช่น DOC, XLS
- OL RE OF: เปิดเผยข้อมูลในรูปแบบมาตรฐานแบบเปิด และไม่จำกัดสิทธิ์โดยบุคคลใด (Non-proprietary) เช่น CSV, ODS, XML, JSON, KML, SHP, KMZ
- OL RE OF URI: เปิดเผยข้อมูลในรูปแบบที่ใช้ยูอาร์ไอในการระบุตัวตนของข้อมูลและชี้ไปยังตำแหน่งของข้อมูลนั้น เช่น RDF (URIs)
- OL RE OF URI LD: เปิดเผยข้อมูลในรูปแบบที่ข้อมูลสามารถเชื่อมโยงไปสู่แหล่งข้อมูลอื่น หรืออ้างอิงข้อมูลในชุดข้อมูลอื่นได้ เช่น RDF (Linked Data)
ข้อ 9 ข้อมูลที่เปิดเผยเป็นข้อมูล Machine-readable ที่ถูกปรับปรุงให้เป็นปัจจุบัน หรือเป็นลักษณะใดลักษณะหนึ่งดังต่อไปนี้: Near Real-Time Feed หรือ Time Series โดยได้รับจากเทคโนโลยีต่าง ๆ เช่น เครื่องมือตรวจวัด (Sensor) หรือกล้องวิดีโอ (Video Camera) หรือไม่
ข้อ 10 ข้อมูลที่เปิดเผยเป็นข้อมูลที่มีการจัดทำอย่างต่อเนื่อง (มีข้อมูลย้อนหลัง 4 ปีขึ้นไป) หรือไม่
จากการพิจารณาตามแนวทางทั้ง 10 ข้อ หากคำตอบของท่านเป็นไปตามแนวทางฯ มากกว่าหรือเท่ากับ 8 จาก 10 ข้อ ถือว่ามีชุดข้อมูลที่มีคุณค่า (Value Datasets) และเมื่อรวมกับแนวทางการเปิดเผยชุดข้อมูลที่มีคุณค่าเป็นเวลา 2 ปีขึ้นไป ผ่านระบบ data.go.th ที่ตรวจสอบได้จากจำนวนการเข้าชมข้อมูลมากกว่า 100 ครั้งต่อปี ทำให้ชุดข้อมูลนั้นสมควรได้รับการพิจารณาว่าเป็นชุดข้อมูลที่มีคุณค่าสูง (High Value Datasets)