magnify
magnify

Open Knowledge for all 

Home e-Book อุปสรรคของการทำ ePub
formats

อุปสรรคของการทำ ePub

Published on July 23, 2013 by in e-Book

นั่งอ่าน Post ของคุณธีรพงษ์ ส. https://www.facebook.com/piakTS เกี่ยวกับการทำ ePub โดยกล่าวถึงภูเขา 2 ภูเขาลูกแรกคือ ในเมืองไทยมีคนที่ทำ epub เป็นน้อยมาก สนพ.ต่าง ๆ แม้จะสนใจตลาดอีบุ๊ค และเริ่มเห็นด้วยกับแนวทางของ booksoho แต่พวกเขาแทบจะไม่รู้จัก epub เลย และภูเขาลูกที่สอง อันนี้คาดไม่ถึงคือ ต้นฉบับสุดท้ายที่สำนักพิมพ์ในเมืองไทยเก็บไว้ จำนวนมากเก็บเป็นไฟล์ pdf

จากภูเขาสองลูกของคุณธีรพงษ์ ส. เป็นประเด็นที่น่าสนใจ และผมก็เห็นด้วยอย่างยิ่ง โดยในปัจจุบันพบว่ามีหลายที่สนใจทำ eBook ในฟอร์แมตต่างๆ รวมทั้ง ePub แต่ไม่น่าเชื่อว่า “หลายๆ ที่จบด้วยการพิมพ์เนื้อหาใหม่ จัดรูปแบบใหม่” โดยไม่สามารถนำแฟ้มเอกสารตั้งต้นมาใช้ได้เลย ทั้งๆ ที่ไม่ควรจะเป็นการสร้างภาระมากขนาดนี้ ซึ่งก็ตรงกับประเด็นภูเขาลูกที่สองนั่นเอง

เอาง่ายๆ เรามาเริ่มจากไฟล์ต้นฉบับปกติก่อน … จะมีสักกี่คนที่ให้ความสำคัญ ความสนใจเก็บไฟล์ต้นฉบับ .doc .docx .odt ไว้เพื่อใช้งานในอนาคต … ส่วนมากจะสนใจการเก็บ “กระดาษ” โดยเฉพาะหน่วยงานที่ต้องประเมิน ประกันคุณภาพ แทบจะละเลยเอกสารดิจิทัลทั้งหมด … และแม้จะมีหลายหน่วยงานลุกขึ้นมาทำ KM ทำคลังเอกสารสถาบัน หรือ IR กลับจบด้วยการนำกระดาษที่พิมพ์นั่นแหล่ะ มาสแกนและนำเข้าระบบ …

ประเด็นถัดมา ก็คือ การว่าจ้างจัดทำตัวเล่ม สัญญาว่าจ้างจะจบด้วยการส่งมอบ “ตัวเล่ม” ที่พิมพ์แล้ว กี่พันเล่ม กี่หมื่นเล่ม แต่ไม่มีการส่งมอบไฟล์ดิจิทัลในฟอร์แมตที่เหมาะสม (ไม่ต้องถามถึงไฟล์ต้นฉบับ .doc ที่ส่งให้ผู้รับจ้าง เพราะไม่มีการเก็บแน่นอน) ดังนั้นแนวทางที่แต่ละหน่วยงานควรดำเนินการคือ ปรับแก้ไขสัญญาว่าจ้างโดยเพิ่มการส่งมอบงานเป็น

  1. ตัวเล่ม จำนวน … เล่ม
  2. ไฟล์ต้นฉบับเอกสาร
  3. ไฟล์ข้อความ .txt
  4. ไฟล์ภาพ .JPG ความละเอียดสูง แยกรายภาพ
  5. ไฟล์ PDF ความละเอียดสูง เหมือนตัวเล่ม
  6. ไฟล์ PDF ความละเอียดปกิต สำหรับการเผยแพร่

เป็นอย่างน้อย …. เพียงเท่านี้ก็สามารถนำไฟล์ข้อความ .txt ไปใช้ทำ ePub ได้แล้วครับ

ประเด็นเอกสารฟอร์แมต PDF ที่นับว่าเป็นเอกสารฟอร์แมตที่มีการเลือกใช้งานมากที่สุด แต่ไม่น่าเชื่อว่าความรู้ในการแปลงเอกสาร PDF ของหลายๆ คนน้อยๆ มาก ไม่รู้ว่าควรกำหนดค่าส่งออก PDF อย่างไรให้เหมาะสม เช่น การฝังฟอนต์กับเอกสาร PDF การส่งออกในฟอร์แมต PDF/A หรือฟอร์แมต PDF/X เพราะการส่งออกโดยไม่กำหนดค่าที่เหมาะสม จะทำให้การสกัดข้อความกลับเกิดปัญหาข้อผิดพลาดต่างๆ นานา เช่น ได้ข้อความขยะ หรือมีจุดผิดพลาดที่สระ วรรณยุกต์

ทั้งนี้มีนักวิจัยพัฒนาเครื่องมือสกัดข้อความออกจากเอกสาร PDF แบบการส่งออก (ไม่ใช่การสแกน) เพื่อแก้ไขปัญหาข้างต้น โดยสามารถใช้บริการ PDF Text Extraction เพื่อแปลงกลับเป็นข้อความ (.txt) ได้ โดยมีเครื่องมือให้เลือกใช้อย่างเช่นเครื่องมือที่ทีมพัฒนา Anti-Kobpae ของเนคเทคพัฒนาขึ้นมา

หรือ http://sourceforge.net/projects/pdf2textpilot/

ประเด็นสุดท้ายที่อยากพูดถึง การสร้างเนื้อหาไม่ว่าจะเป็น MS Word, Writer หรือ DTP ต่างๆ แทบจะเป็นการพิมพ์แบบตามใจฉัน ความสามารถที่เหมาะสมอย่าง Style แทบไม่มีการใช้งาน ซึ่งความสามารถ Style นี่แหล่ะครับที่เป็นตัวช่วยในการแปลงเอกสาร Word หรือ DTP format เป็น ePub ได้ง่าย สะดวก รวดเร็ว

ประเด็นอาจจะเยอะ และเป็นเทคนิค แต่ก็อยากเสนอเป็นเบื้องต้นไว้ก่อนครับ ไว้มีโอกาสแลกเปลียนกันนะครับ– ( 367 Views)

 
 Share on Facebook Share on Twitter Share on Reddit Share on LinkedIn
No Comments  comments 

Leave a Reply

Your email address will not be published. Required fields are marked *

*


1 + five =

You may use these HTML tags and attributes: <a href="" title=""> <abbr title=""> <acronym title=""> <b> <blockquote cite=""> <cite> <code> <del datetime=""> <em> <i> <q cite=""> <strike> <strong>