Ethical AI-Ready Data Governance Maturity Assessment

“วัดระดับความพร้อมของข้อมูล การกำกับดูแล และการใช้ AI อย่างมีจริยธรรม”

Ethical AI-Ready Data

Layer 1
Data Layer

(รากฐานข้อมูลคุณภาพสำหรับ AI)

1.1 Data Quality Assessment Checklist
1.2 Metadata Completeness Checklist

1.1 Data Quality Assessment Checklist

Checklist นี้ใช้ประเมินคุณภาพข้อมูล (Data Quality) ที่นำมาใช้ในการพัฒนา AI เพื่อให้มั่นใจว่าข้อมูลมีคุณภาพและเหมาะสมในการนำไปใช้พัฒนาโมเดล AI โดย Checklist นี้อ้างอิงตามมิติด้านคุณภาพข้อมูล 7 มิติ ตามหลักการ Data Governance ของ DAMA และ AI-Ready Data ของ Gartner

เกณฑ์การประเมิน:
ระดับ 1: ไม่มีการดำเนินการ/มีความพร้อมต่ำมาก/มีความเสี่ยงสูง
ระดับ 2: มีการดำเนินการบางส่วน/วางแผนไว้แต่ยังไม่สมบูรณ์/มีความพร้อมปานกลาง-ต่ำ
ระดับ 3: มีการดำเนินการส่วนใหญ่/มีความพร้อมดี/เป็นไปตามมาตรฐานส่วนใหญ่
ระดับ 4: มีการดำเนินการครบถ้วนสมบูรณ์/มีความพร้อมสูงมาก/เป็นแนวปฏิบัติที่ดีเลิศ (Best Practice)

มิติคุณภาพ
Integrity

(ความครบถ้วนถูกต้องของข้อมูล)

1ข้อมูลที่จัดเก็บในระบบมีการเปลี่ยนแปลงหรือแก้ไขโดยผู้ที่ได้รับอนุญาต และสามารถตรวจสอบย้อนกลับได้อย่างชัดเจน

2ข้อมูลที่จัดเก็บมีความถูกต้องในเชิงความสัมพันธ์ระหว่างชุดข้อมูล โดยไม่มีข้อผิดพลาดในการเชื่อมโยง

3ข้อมูลที่จัดเก็บสามารถตรวจสอบความถูกต้องย้อนกลับไปถึงแหล่งที่มาต้นทางได้ครบถ้วนและชัดเจน

4อัตราส่วนของข้อมูลที่มีการเชื่อมโยงผิดพลาดหรือไม่ถูกต้อง
(% Referential Integrity Errors) (Target: < 1%)

%

5อัตราส่วนของข้อมูลที่ถูกเปลี่ยนแปลงโดยไม่ได้รับอนุญาต
(% Unauthorized Data Modifications) (Target: 0%)

%

มิติคุณภาพ
Accuracy

(ความถูกต้อง)

1ข้อมูลที่จัดเก็บมีความถูกต้องตรงตามแหล่งข้อมูลต้นฉบับ

2มีการตรวจสอบความถูกต้องของข้อมูลก่อนนำไปใช้งานทุกครั้ง

3ข้อมูลที่ใช้งานมีความทันสมัยและเป็นข้อมูลล่าสุดเสมอ

4อัตราส่วนของข้อมูลที่ตรวจสอบแล้วว่าถูกต้อง
(% Accuracy Rate) (Target: ≥ 98%)

%

5อัตราส่วนของข้อมูลผิดพลาดจากการป้อนข้อมูล
(% Data Entry Error Rate) (Target: < 2%)

%

6อัตราส่วนของข้อมูลที่ตรงกับแหล่งต้นฉบับ
(% Data Matching Source) (Target: ≥ 99%)

%

มิติคุณภาพ
Completeness

(ความครบถ้วน)

1ข้อมูลที่จำเป็นต่อการใช้งานมีการจัดเก็บไว้อย่างครบถ้วน

2มีการกำหนดช่องหรือประเภทข้อมูลที่จำเป็นครบทุกช่องในการจัดเก็บ

3มีการตรวจสอบข้อมูลที่จัดเก็บว่าครบถ้วนและไม่มีข้อมูลสำคัญสูญหาย

4อัตราส่วนของข้อมูลที่มีครบถ้วนทุกช่องที่กำหนด
(% Completeness Rate) (Target: ≥ 95%)

%

5อัตราส่วนข้อมูลสำคัญที่ขาดหาย
(% Critical Data Missing) (Target: < 1%)

%

6ค่าเฉลี่ยเปอร์เซ็นต์ความครบถ้วนต่อหนึ่งรายการข้อมูล
(% Average Completeness per Record) (Target: ≥ 95%)

%

มิติคุณภาพ
Consistency

(ความสอดคล้อง)

1ข้อมูลมีรูปแบบและมาตรฐานที่สม่ำเสมอในทุกระบบ

2มีมาตรฐานหรือคู่มือที่ชัดเจนสำหรับการบันทึกข้อมูลในทุกระบบ

3ข้อมูลที่แสดงผลในแต่ละระบบมีความสอดคล้องและไม่ขัดแย้งกัน

4อัตราส่วนของข้อมูลที่มีความสอดคล้องในทุกระบบ
(% Consistency Across Systems) (Target: ≥ 95%)

%

5อัตราส่วนของข้อมูลที่มีรูปแบบไม่สอดคล้องกัน
(% Format Consistency Errors) (Target: < 2%)

%

มิติคุณภาพ
Timeliness

(ความทันสมัย)

1ข้อมูลได้รับการอัพเดตภายในกรอบเวลาที่กำหนดไว้อย่างชัดเจน

2ข้อมูลมีความพร้อมใช้งานทันทีเมื่อจำเป็น

3มีการกำหนดกระบวนการและรอบการอัพเดตข้อมูลอย่างชัดเจน

4ระยะเวลาเฉลี่ยที่ข้อมูลล่าช้าจากรอบการอัพเดตที่กำหนด
(Average Data Latency (Days/Hours)) (Target: ≤ 24 ชั่วโมง)

%

5อัตราส่วนของข้อมูลที่ถูกอัพเดตตามรอบเวลา
(% Timely Updated Data) (Target: ≥ 95%)

%

มิติคุณภาพ
Uniqueness

(ความไม่ซ้ำซ้อน)

1มีการตรวจสอบข้อมูลซ้ำซ้อนก่อนการจัดเก็บเข้าระบบทุกครั้ง

2ข้อมูลมีการจัดเก็บอย่างเป็นระบบโดยไม่เกิดการซ้ำซ้อนในหลายแหล่ง

3มีระบบหรือกระบวนการที่ชัดเจนในการตรวจจับและจัดการข้อมูลซ้ำซ้อน

4อัตราส่วนข้อมูลที่ซ้ำซ้อนในระบบ
(% Duplicate Data Rate) (Target: < 1%)

%

5จำนวน Record ที่พบการซ้ำซ้อน
(# Duplicated Records) (Target: เข้าใกล้ 0 รายการ)

%

มิติคุณภาพ
Validity

(ความถูกต้องตามรูปแบบ)

1ข้อมูลถูกต้องตามรูปแบบและเงื่อนไขที่กำหนดไว้

2ข้อมูลที่จัดเก็บเป็นไปตามมาตรฐานและข้อกำหนดขององค์กร

3ประเภทและรูปแบบของข้อมูลถูกต้องตรงตามที่กำหนดไว้

4อัตราส่วนของข้อมูลที่ผิดจากกฎหรือรูปแบบที่กำหนด
(% Validity Errors) (Target: < 1%)

%

5อัตราส่วนข้อมูลที่ผ่านเกณฑ์หรือมาตรฐานที่กำหนดไว้
(% Data Compliance Rate) (Target: ≥ 95%)

%
1.2 Metadata Completeness Checklist

Checklist นี้ใช้ประเมินความครบถ้วนของ Metadata ที่ใช้ในการพัฒนา AI เพื่อให้มั่นใจว่าข้อมูลมีการอธิบายที่สมบูรณ์ ถูกต้อง และสามารถนำไปใช้ต่อยอดได้อย่างมีประสิทธิภาพ โดย Checklist นี้สอดคล้องกับหลักการของ Data Governance และ AI Governance ที่อิงจากมาตรฐานสากล เช่น DM-BOK, GDPR, PDPA และ AI Act

เกณฑ์การประเมิน:
4 = ดีเยี่ยม: มีข้อมูล Metadata ครบถ้วน ชัดเจน และเป็นไปตาม Standard Metadata Documentation Template
3 = ดี: มีข้อมูล Metadata เกือบครบถ้วน แต่ยังขาดบางส่วนที่ไม่ส่งผลกระทบต่อการใช้งานมากนัก
2 = พอใช้: ข้อมูล Metadata มีรายละเอียดสำคัญเพียงบางส่วน แต่ยังไม่เพียงพอในการสนับสนุนการนำข้อมูลไปใช้ได้อย่างสมบูรณ์
1 = ต้องปรับปรุง: ขาด Metadata ที่จำเป็นอย่างมีนัยสำคัญ ส่งผลต่อความสามารถในการใช้งานข้อมูล

Checklist Items

(รายการตรวจสอบ)

1ระบุแหล่งที่มาของข้อมูล (Data Source) ไว้อย่างชัดเจน

2ระบุวัตถุประสงค์ของการใช้งานข้อมูล (Purpose of Use) อย่างชัดเจน

3จัดทำพจนานุกรมข้อมูล (Data Dictionary) อย่างครบถ้วน ถูกต้อง และชัดเจน

4ระบุช่วงเวลาที่เกี่ยวข้องของข้อมูล (Temporal Coverage) อย่างชัดเจน

5ระบุขอบเขตเชิงพื้นที่ของข้อมูล (Spatial Coverage) อย่างชัดเจน

6ระบุผู้รับผิดชอบหรือเจ้าของข้อมูล (Data Owner) อย่างชัดเจน

7จัดทำการควบคุม Version ข้อมูล (Version Control) อย่างชัดเจน

8ระบุเงื่อนไขหรือข้อจำกัดในการใช้งานข้อมูล (Conditions & Constraints) อย่างชัดเจน

9ระบุรูปแบบหรือโครงสร้างของข้อมูล (Format/Structure) อย่างชัดเจน

10ระบุข้อมูลอื่นที่เกี่ยวข้องหรือเชื่อมโยง (Related Data References) อย่างชัดเจน