Data Mining คืออะไร อีกวิธีในการมองโลก? มาเรียนรู้เกี่ยวกับคำจำกัดความ กรณี กระบวนการ พื้นที่ใช้งาน และความเป็นไปได้ในการพัฒนาการทำเหมืองข้อมูลในอนาคต


ทุกคนคงเคยมีประสบการณ์พลาดรถบัสหรือรถไฟใต้ดินเที่ยวสุดท้ายอย่างน้อยหนึ่งครั้งและต้องนั่งแท็กซี่กลับบ้านตอนดึก นานมาแล้ว กรุงโซล ประเทศเกาหลีใต้ เริ่มให้บริการรถโดยสารรอบดึกเพื่อให้ผู้คนสามารถใช้ระบบขนส่งสาธารณะแทนรถแท็กซี่ในช่วงเวลาดึกได้ เส้นทางรถประจำทางช่วงดึกได้รับการตัดสินใจโดยพิจารณาจากข้อมูลปริมาณการจราจรที่สถานีรถไฟใต้ดินและสถานีขนส่งหลักๆ นอกจากนี้ เมื่อค้นหาหนังสือในห้างสรรพสินค้าออนไลน์ คุณอาจพบ 'ผลิตภัณฑ์ที่ลูกค้าที่ดูผลิตภัณฑ์นี้ด้วย' และ 'หนังสือแนะนำแบบกำหนดเอง' ด้วยวิธีนี้ เทคโนโลยีการทำเหมืองข้อมูลจึงฝังลึกอยู่ในชีวิตของเรา ปัจจุบัน เทคโนโลยีการทำเหมืองข้อมูลกำลังถูกประยุกต์ใช้กับสาขาต่างๆ เช่น การขนส่งสาธารณะ ห้างสรรพสินค้าออนไลน์ เครื่องมือค้นหาทางอินเทอร์เน็ต บริการเครือข่ายสังคม และอุตสาหกรรมทางการเงิน การทำเหมืองข้อมูลหมายถึงกระบวนการประมวลผลและประมวลผลข้อมูลเพื่อให้ได้ข้อสรุปที่มีความหมายตามทฤษฎีทางสถิติและพลังการประมวลผลของคอมพิวเตอร์ การทำเหมืองข้อมูลจะทำให้เกิดการเปลี่ยนแปลงอะไรบ้างในชีวิตของเรา?

ข้อมูลเป็นผลผลิตจากกระบวนการประมวลผลโลกและแปลงเป็นรูปแบบที่เราเห็นได้ง่ายขึ้น ข้อมูลสามารถมีอยู่ในรูปแบบใดก็ได้ เช่น ข้อมูลข้อความในภาษาเขียน ข้อมูลภาพถ่าย ตลอดจนเสียงและวิดีโอ การทำเหมือง ซึ่งหมายถึง "การทำเหมือง" และข้อมูลถูกรวมเข้าด้วยกัน และคำว่า การทำเหมืองข้อมูล ได้ถูกสร้างขึ้น เป้าหมายของการขุดข้อมูลคือการค้นหาความสัมพันธ์และรูปแบบโดยใช้ข้อมูล การทำเหมืองข้อมูลเป็นสาขาหนึ่งของวิศวกรรมอุตสาหการ และสะท้อนถึงแก่นของวิศวกรรมอุตสาหการได้เป็นอย่างดี ซึ่งก็คือการวิเคราะห์ลักษณะของวัตถุเฉพาะเจาะจงผ่านวิธีทางสถิติและวิศวกรรมคอมพิวเตอร์

ข้อมูลข้อความสามารถรับได้จากโพสต์ของผู้ใช้ในโซเชียลเน็ตเวิร์ก และข้อมูลตัวเลขสามารถรับได้จากการเปลี่ยนแปลงราคาหุ้นในตลาดการเงิน ข้อมูลที่ได้รับจากสถานที่ที่หลากหลายดังกล่าวสามารถประมวลผลได้อย่างไร? ซึ่งทำได้โดยใช้วิธีการที่เรียกว่าสถิติและเครื่องมือที่เรียกว่าการเขียนโปรแกรม มีการดำเนินงานหลักสองประการ ได้แก่ การลบข้อมูลที่ไม่จำเป็นออก และดำเนินการวิเคราะห์ทางสถิติกับข้อมูลที่เหลือ

ข้อมูลที่ได้รับในลักษณะนี้สามารถนำไปใช้ได้อย่างไร? การทำเหมืองข้อมูลไม่เพียงส่งผลต่อชีวิตประจำวันของเราเท่านั้น แต่ยังส่งผลต่อการเปลี่ยนแปลงในสังคมและประเทศชาติโดยรวมด้วย Google ซึ่งเป็นเครื่องมือค้นหาที่เป็นตัวแทนกำลังพยายามคาดการณ์การเปลี่ยนแปลงในสังคมโดยรวมโดยใช้ความถี่ของข้อความค้นหาที่เฉพาะเจาะจง ตัวอย่างเช่น หากความถี่ของข้อความค้นหาที่เกี่ยวข้องกับโรคหวัด เช่น หวัด หน้ากาก และยาแก้หวัด เพิ่มขึ้น ก็สรุปได้ว่าจะมีโรคระบาดในวงกว้างเป็นวงกว้าง

เนื่องจากข้อมูลสามารถมีอยู่ในรูปแบบใดก็ได้ จึงไม่มีข้อจำกัดในด้านที่สามารถทำเหมืองข้อมูลได้ ‘เทคโนโลยีการประมวลผลภาษาธรรมชาติ’ ซึ่งมีการใช้งานอย่างต่อเนื่องตลอด 10 ปีที่ผ่านมา มีคุณค่าที่มีศักยภาพสูง นักวิชาการกำลังพัฒนานักแปลสากลโดยใช้ข้อมูลจำนวนมหาศาล แม้กระทั่งขณะนี้ นักวิชาการกำลังวิจัยอย่างต่อเนื่องเพื่อสร้างโลกที่เราสามารถสื่อสารถึงกันได้ไม่ว่าเราจะใช้ภาษาใดก็ตาม หากกำแพงภาษาหายไป โลกก็จะเปลี่ยนไปในทางที่แตกต่างไปจากที่เป็นอยู่ในปัจจุบันอย่างสิ้นเชิง นอกจากนี้ หุ่นยนต์ปัญญาประดิษฐ์ที่สามารถสนทนาอย่างเป็นธรรมชาติโดยใช้ภาษามนุษย์จะได้รับการพัฒนาและจะทำหน้าที่เป็นคู่สนทนาสำหรับผู้สูงอายุตามสังคมทุกวัย ขนาดของอุตสาหกรรมการดูแลสุขภาพซึ่งให้บริการทางการแพทย์ที่ปรับแต่งตามความต้องการโดยการวิเคราะห์สัญญาณร่างกายแบบเรียลไทม์จะเติบโตขึ้น นอกจากนี้ เทคโนโลยีการทำเหมืองข้อมูลยังเจริญรุ่งเรืองในหลายด้าน เช่น การสืบสวนคดีอาชญากรรมที่ใช้เครือข่ายข้อมูล CCTV ต่างๆ เพื่อติดตามอาชญากร

ด้วยวิธีนี้ เราจึงพิจารณาคำถามว่าข้อมูลคืออะไร กระบวนการขุดข้อมูล พื้นที่ใช้งาน และความเป็นไปได้ในการพัฒนาในอนาคต ดังที่นักปรัชญาชาวฝรั่งเศส Marcel Proust กล่าวว่า "การค้นพบที่แท้จริงไม่ใช่การค้นหาดินแดนใหม่ แต่เป็นการเห็นมันด้วยตาใหม่" เทคโนโลยีการขุดข้อมูลยังช่วยให้เรามองเห็นโลกในรูปแบบใหม่อีกด้วย