รู้จัก Computer Vision เทคโนโลยีที่ทำให้ AI มองเห็น

หากใครคุ้ยเคยกับการทำงานของ AI ไม่ว่าจะเป็น ผู้ช่วยเสมือนบนมือถือ หรือนักแข่งขัน Go ของ Google ที่ล้มแชมป์โลกมาแล้ว ทั้งสองอย่างนี้ เป็น AI ที่ทำงานแตกต่างกันออกไปครับ และโลกนี้ได้เอา AI ไปประยุกต์ใช้ในหลาย ๆ รูปแบบ
.
Computer Vision นั้น เป็นสาขาย่อยของ AI โดยเฉพาะ หาก AI อนุญาตให้เครื่องจักรคิดเองได้ Computer Vision ก็คือสิ่งที่ทำให้เครื่องจักรมองเห็น ซึ่งในทางเทคนิคแล้ว มันทำให้เครื่องจักรสามารถจดจำ ทำความเข้าใจ และตอบสนองต่อข้อมูลภาพ เช่น รูปภาพ วิดีโอ และอินพุตภาพอื่น ๆ ซึ่งจะเน้นใช้งานกับภาพเป็นหลัก
.
ในช่วงไม่กี่ปีที่ผ่านมา Computer Vision ได้กลายเป็นตัวขับเคลื่อนหลักของ AI เทคนิคนี้ใช้กันอย่างแพร่หลายในอุตสาหกรรมต่าง ๆ เช่น การผลิต อีคอมเมิร์ซ เกษตรกรรม ยานยนต์ และยา เป็นต้น
.
นอกจากนี้ มันยังเป็นตัวขับคลื่อนเทคโนโลยีทุกอย่าง ตั้งแต่การซื้อของที่ใช้ AR เพื่อให้เห็นภาพจริงและรายละเอียดสินค้า การวิเคราะห์ทางการแพทย์ และความสามารถในการขับขี่รถยนต์อัตโนมัติใน Tesla และแบรนด์รถยนต์อื่น ๆ มีการคาดการณ์ว่า ภายในปี 2022 ตลาดทั่วโลกสำหรับสาขาย่อยคาดว่าจะสูงถึง 48.6 พันล้านดอลลาร์ต่อปี เพิ่มขึ้นจาก 6.6 พันล้านดอลลาร์ในปี 2558
.
แม้มันจะเป็นเทคโนโลยีที่ถูกใช้งานอย่างแพร่หลาย แต่พอใช้งานจริง มันดันมีอคติ เพราะเคยมีข่าวว่า กล้องวงจรปิดที่ใช้ AI ในสหรัฐอเมริกาตรวจจับคนและเคร่งครัดกับคนผิวสีมากกว่าคนผิวขาว ทำให้เกิดคำถามว่า AI ทำงานอย่างถูกต้องจริง ๆ หรือเปล่า…
.
เพื่อให้เข้าใจ Computer Vision สิ่งสำคัญคือต้องเข้าใจว่ามันทำงานอย่างไร ใช้งานอย่างไร และทั้งความท้าทายที่มันเอาชนะและปัญหาที่ยังคงเผชิญอยู่ในปัจจุบัน
.
Computer Vision ทำงานยังไง ?
หลักการทำงานของ Computer Vision นั้นแบ่งออกเป็นหลายแบบครับ โดยจะมีทั้งการแบ่งส่วนของภาพ แบ่งภาพออกเป็นส่วน ๆ และตรวจสอบเป็นรายบุคคล , การจดจำรูปแบบ ซึ่งจะเป็นดูภาพซ้ำ ๆ และนำวิเคราะห์กับเคสที่เกิดขึ้น โดยวิธีนี้มีประโยชน์ทางการแพทย์ในการวิเคราะห์อาการผู้ป่วย , การจำแนกวัตถุ ค้นหา และติดตามวัตถุ ยกตัวอย่างเช่น ติดตามผู้ร้ายจากข้อมูลในกล้องวงจรปิด สุดท้าย การจดจำใบหน้า ซึ่งเป็นรูปแบบการตรวจจับวัตถุขั้นสูงที่สามารถตรวจจับและระบุใบหน้ามนุษย์ได้ครับ
.
Computer Vision นั้น จะใช้งานโครงข่ายประสาทเทียมในการจัดเรียงข้อมูลจำนวนมหาศาลจนกว่าจะเข้าใจสิ่งที่กำลังดูอยู่ ยกตัวอย่างในการอธิบายง่าย ๆ ก็คือ หากต้องการให้คอมพิวเตอร์แยกระหว่าง ภาพถ่ายไอศครีมกับพิซซ่าเป็ปเปอร์โรนี เราจำเป็นต้องมีภาพถ่ายไอศครีมและพิซซ่าจำนวนมากเพื่อให้ AI ได้ดู จากนั้น AI จะนำรูปภาพทั้งหมดไปประมวลหลายขั้นและหลายเลเยอร มันจะสร้างเป็นโครงข่ายประสาทเทียมขึ้นมาเพื่อแยกไอศกรีมออกจากพิซซ่าเป็ปเปอร์โรนีทีละขั้นโดยดูจากคุณสมบัติพื้นฐานของสิ่ง ๆ นั้น เช่น เส้นขอบระหว่างส่วนที่สว่างและมืดของรูปภาพ และเลเยอร์ที่ซับซ้อนมากขึ้นจะดูรูปร่างหรือส่วนอื่น ๆ ครับ
.
สิ่งที่ทำให้ Computer Vision คาดว่าน่าจะเป็นจากการที่มนุษย์ใส่ภาพเข้าไป ถ้าคนสร้าง AI อคติ แน่นอนว่า AI ที่ถูกสร้างขึ้น อาจจะมีลักษณะนิสัยไม่ต่างกันครับ
.
ทั้งนี้ Computer Vision เกิดขึ้นตั้งแต่ปี 1950 แต่เป็นเทคนิคที่ค่อนข้างจะ Manual สุด ๆ มีแนวโน้วจะผิดพลาด และไม่ได้ใช้งานกับคอมพิวเตอร์ แต่ตลอดช่วงสองสามทศวรรษที่ผ่านมา ความก้าวหน้าทางด้านเทคโนโลยีที่เพิ่มขึ้น ได้ช่วยปูทางสำหรับ Computer Vision เช่น มีการพัฒนาเทคโนโลยีการสแกนภาพลงคอมพิวเตอร์ ซึ่งเป็นครั้งแรกที่คอมพิวเตอร์สามารถแปลงภาพปกติเป็นดิจิทัลได้ครับ
.
จากนั้นก็มีการพัฒนาความสามารถในการเปลี่ยนภาพสองมิติให้เป็นรูปแบบสามมิติ รวมทั้งการเกิดขึ้นของเทคโนโลยีการจดจำวัตถุที่สามารถจดจำข้อความต่าง ๆ ได้ ทำให้ Computer Vision เป็นรูปเป็นร่างตั้งแต่นั้นมา และทำให้เห็นในปัจจุบันครับ
.
แหล่งข้อมูล
https://hackernoon.com/a-brief-history-of-computer-vision-and-convolutional-neural-networks-8fe8aacc79f3

https://omdia.tech.informa.com/products/computer-vision-technologies-and-markets-report—2020