นั่งอ่าน Post ของคุณธีรพงษ์ ส. https://www.facebook.com/piakTS เกี่ยวกับการทำ ePub โดยกล่าวถึงภูเขา 2 ภูเขาลูกแรกคือ ในเมืองไทยมีคนที่ทำ epub เป็นน้อยมาก สนพ.ต่าง ๆ แม้จะสนใจตลาดอีบุ๊ค และเริ่มเห็นด้วยกับแนวทางของ booksoho แต่พวกเขาแทบจะไม่รู้จัก epub เลย และภูเขาลูกที่สอง อันนี้คาดไม่ถึงคือ ต้นฉบับสุดท้ายที่สำนักพิมพ์ในเมืองไทยเก็บไว้ จำนวนมากเก็บเป็นไฟล์ pdf
จากภูเขาสองลูกของคุณธีรพงษ์ ส. เป็นประเด็นที่น่าสนใจ และผมก็เห็นด้วยอย่างยิ่ง โดยในปัจจุบันพบว่ามีหลายที่สนใจทำ eBook ในฟอร์แมตต่างๆ รวมทั้ง ePub แต่ไม่น่าเชื่อว่า “หลายๆ ที่จบด้วยการพิมพ์เนื้อหาใหม่ จัดรูปแบบใหม่” โดยไม่สามารถนำแฟ้มเอกสารตั้งต้นมาใช้ได้เลย ทั้งๆ ที่ไม่ควรจะเป็นการสร้างภาระมากขนาดนี้ ซึ่งก็ตรงกับประเด็นภูเขาลูกที่สองนั่นเอง
เอาง่ายๆ เรามาเริ่มจากไฟล์ต้นฉบับปกติก่อน … จะมีสักกี่คนที่ให้ความสำคัญ ความสนใจเก็บไฟล์ต้นฉบับ .doc .docx .odt ไว้เพื่อใช้งานในอนาคต … ส่วนมากจะสนใจการเก็บ “กระดาษ” โดยเฉพาะหน่วยงานที่ต้องประเมิน ประกันคุณภาพ แทบจะละเลยเอกสารดิจิทัลทั้งหมด … และแม้จะมีหลายหน่วยงานลุกขึ้นมาทำ KM ทำคลังเอกสารสถาบัน หรือ IR กลับจบด้วยการนำกระดาษที่พิมพ์นั่นแหล่ะ มาสแกนและนำเข้าระบบ …
ประเด็นถัดมา ก็คือ การว่าจ้างจัดทำตัวเล่ม สัญญาว่าจ้างจะจบด้วยการส่งมอบ “ตัวเล่ม” ที่พิมพ์แล้ว กี่พันเล่ม กี่หมื่นเล่ม แต่ไม่มีการส่งมอบไฟล์ดิจิทัลในฟอร์แมตที่เหมาะสม (ไม่ต้องถามถึงไฟล์ต้นฉบับ .doc ที่ส่งให้ผู้รับจ้าง เพราะไม่มีการเก็บแน่นอน) ดังนั้นแนวทางที่แต่ละหน่วยงานควรดำเนินการคือ ปรับแก้ไขสัญญาว่าจ้างโดยเพิ่มการส่งมอบงานเป็น
- ตัวเล่ม จำนวน … เล่ม
- ไฟล์ต้นฉบับเอกสาร
- ไฟล์ข้อความ .txt
- ไฟล์ภาพ .JPG ความละเอียดสูง แยกรายภาพ
- ไฟล์ PDF ความละเอียดสูง เหมือนตัวเล่ม
- ไฟล์ PDF ความละเอียดปกิต สำหรับการเผยแพร่
เป็นอย่างน้อย …. เพียงเท่านี้ก็สามารถนำไฟล์ข้อความ .txt ไปใช้ทำ ePub ได้แล้วครับ
ประเด็นเอกสารฟอร์แมต PDF ที่นับว่าเป็นเอกสารฟอร์แมตที่มีการเลือกใช้งานมากที่สุด แต่ไม่น่าเชื่อว่าความรู้ในการแปลงเอกสาร PDF ของหลายๆ คนน้อยๆ มาก ไม่รู้ว่าควรกำหนดค่าส่งออก PDF อย่างไรให้เหมาะสม เช่น การฝังฟอนต์กับเอกสาร PDF การส่งออกในฟอร์แมต PDF/A หรือฟอร์แมต PDF/X เพราะการส่งออกโดยไม่กำหนดค่าที่เหมาะสม จะทำให้การสกัดข้อความกลับเกิดปัญหาข้อผิดพลาดต่างๆ นานา เช่น ได้ข้อความขยะ หรือมีจุดผิดพลาดที่สระ วรรณยุกต์
ทั้งนี้มีนักวิจัยพัฒนาเครื่องมือสกัดข้อความออกจากเอกสาร PDF แบบการส่งออก (ไม่ใช่การสแกน) เพื่อแก้ไขปัญหาข้างต้น โดยสามารถใช้บริการ PDF Text Extraction เพื่อแปลงกลับเป็นข้อความ (.txt) ได้ โดยมีเครื่องมือให้เลือกใช้อย่างเช่นเครื่องมือที่ทีมพัฒนา Anti-Kobpae ของเนคเทคพัฒนาขึ้นมา
หรือ http://sourceforge.net/projects/pdf2textpilot/
ประเด็นสุดท้ายที่อยากพูดถึง การสร้างเนื้อหาไม่ว่าจะเป็น MS Word, Writer หรือ DTP ต่างๆ แทบจะเป็นการพิมพ์แบบตามใจฉัน ความสามารถที่เหมาะสมอย่าง Style แทบไม่มีการใช้งาน ซึ่งความสามารถ Style นี่แหล่ะครับที่เป็นตัวช่วยในการแปลงเอกสาร Word หรือ DTP format เป็น ePub ได้ง่าย สะดวก รวดเร็ว
ประเด็นอาจจะเยอะ และเป็นเทคนิค แต่ก็อยากเสนอเป็นเบื้องต้นไว้ก่อนครับ ไว้มีโอกาสแลกเปลียนกันนะครับ– ( 367 Views)