Big data: การกลั่นความหมายจากข้อมูล

Big data: การกลั่นความหมายจากข้อมูล

ข้อมูลที่ฝังอยู่ในกระแสข้อมูลจำนวนมหาศาล

เป็นเบาะแสของวิทยาศาสตร์ใหม่ แต่เราอาจจำเป็นต้องสร้างเลนส์ใหม่เพื่อให้มองเห็นได้ เฟลิซ แฟรงเคิลและโรซาลินด์ รีดอธิบาย

เป็นเวลาอันน่าทึ่งในวิทยาศาสตร์เมื่อข้อมูลจำนวนมากหลั่งไหลเข้ามา พร้อมให้คำมั่นว่าจะมีข้อมูลเชิงลึกใหม่ๆ แต่เราจะค้นหาความหมายในเทราไบต์เหล่านี้ได้อย่างไร ในการค้นหาวิทยาศาสตร์ใหม่ในชุดข้อมูลขนาดใหญ่ได้สำเร็จ เราต้องค้นหารูปแบบที่คาดไม่ถึงและตีความหลักฐานในลักษณะที่กำหนดกรอบคำถามใหม่และแนะนำการสำรวจเพิ่มเติม นิสัยเก่าในการแสดงข้อมูลอาจล้มเหลวในการรับมือกับความท้าทายเหล่านี้ ทำให้เราเข้าถึงมากกว่าคำถามและคำตอบที่คุ้นเคย

เพื่อแยกความหมายใหม่ออกจากทะเลของข้อมูล นักวิทยาศาสตร์ได้เริ่มใช้เครื่องมือในการสร้างภาพข้อมูล ยังมีเพียงไม่กี่คนที่ชื่นชมว่าการแสดงภาพเป็นรูปแบบหนึ่งของการสื่อสารด้วย ผู้เชี่ยวชาญด้านการสื่อสารจำนวนมากมีศักยภาพในการปรับปรุงเครื่องมือเหล่านี้อย่างมาก เราขอเสนอว่าควรนำนักวาดภาพกราฟิก นักสื่อสาร และนักวิทยาศาสตร์ด้านการสร้างภาพมาสนทนากับนักทฤษฎีและผู้ทดลองก่อนที่จะรวบรวมข้อมูลทั้งหมด หากเราออกแบบการทดลองในลักษณะที่เสนอโอกาสที่หลากหลายในการนำเสนอและสื่อสารข้อมูล เทคนิคในการดึงความเข้าใจใหม่ ๆ ก็สามารถใช้ได้

การแสดงภาพเป็นสิ่งที่คุ้นเคยในฟิลด์ที่มีข้อมูลมาก หลายปีก่อนที่เครื่องตรวจจับจะถูกสร้างขึ้นสำหรับโรงงาน เช่น Large Hadron Collider ใกล้เจนีวา นักฟิสิกส์จะศึกษาการจำลอง พวกเขาตรวจสอบว่าเหตุการณ์สำคัญจะ ‘ดู’ อย่างไรในจอแสดงผลที่เปิดเผยและสื่อสารถึงสิ่งที่เกิดขึ้นภายในเครื่อง การอภิปรายดังกล่าวมักจะเกิดขึ้นภายในการประชุมเชิงภาพของภาคสนาม แต่บางทีการสนทนาอาจถูกขยายออกไปเพื่อพิจารณาการแสดงข้อมูลอื่นแทนข้อมูลเดียวกัน สิ่งเหล่านี้อาจแนะนำวิธีการอื่นๆ ในการรวบรวม จัดระเบียบ และสืบค้นข้อมูลที่จะเพิ่มความโปร่งใสของผลการทดลอง และช่วยสัญชาตญาณ การค้นพบ และการสื่อสาร

การอภิปรายการสื่อสารด้วยภาพก่อนออกแบบการทดลองอาจเปิดเผยวิทยาศาสตร์ใหม่ เครดิต: D. ARMENDARIZ

น่าเสียดายที่ผู้เชี่ยวชาญด้านการแสดงภาพ

และผู้สื่อสารมักได้รับการปรึกษาหลังจากมีการจัดระเบียบและจัดเก็บข้อมูลเท่านั้น ด้วยความหวังว่าพวกเขาจะสร้างการแสดงคอมพิวเตอร์ สไลด์ และตัวเลขสำหรับการเผยแพร่ ในขณะเดียวกัน พวกเขาอาจกำลังพัฒนาเครื่องมือของตนอย่างโดดเดี่ยว โดยนักวิทยาศาสตร์ที่กำลังยุ่งอยู่กับการทดลองทำการทดลอง โอกาสในการสนทนาที่มีประโยชน์จึงสูญเปล่า

เมื่อนักวิทยาศาสตร์ ศิลปินกราฟิค นักเขียน แอนิเมชั่น และนักออกแบบคนอื่นๆ มารวมตัวกันเพื่อหารือเกี่ยวกับปัญหาในการแสดงภาพทางวิทยาศาสตร์ เช่น เวิร์กช็อป Image and Meaning ที่ดำเนินการโดยมหาวิทยาลัยฮาร์วาร์ด (http://www.imageandmeaning.org) ก็จะกลายเป็น ชัดเจนว่าการแสดงซ้ำ ๆ ล้มเหลวในการสื่อสารความเข้าใจหรือตอบคำถามที่ชัดเจนเกี่ยวกับข้อมูลพื้นฐาน การแสดงปริมาณสามมิติอาจไม่แสดงความไม่แน่นอนที่สำคัญหรือช่องว่างของข้อมูล พื้นผิวที่เป็นของแข็งหรือขอบคมอาจแนะนำข้อมูลที่ไม่มีอยู่จริง ศิลปินกราฟิกอาจเสนอวิธีที่จะเปิดเผยช่องว่างหรือการเบี่ยงเบนไปจากความคาดหวังในช่วงต้นของการทดลอง แนวทางในการรวบรวมข้อมูลในภายหลัง หรือเน้นให้เห็นถึงช่องทางใหม่ๆ ในการสอบถาม เมื่อเราขอให้ George Whitesides นักเคมีจากมหาวิทยาลัยฮาร์วาร์ดเปลี่ยนเรขาคณิตของชั้นโมโนที่ประกอบขึ้นเองด้วยบริเวณที่ไม่ชอบน้ำและชอบน้ำที่วาดโครงร่างไว้อย่างชัดเจนเพื่อสร้างภาพเพื่อนำเสนอในวารสาร เขาพบว่าตัวเองออกแบบการทดลองใหม่ และวิทยาศาสตร์ที่ไม่คาดคิดก็ปรากฏขึ้น

เวิร์กช็อปและแบบฝึกหัดของนักเรียน เช่น โครงการ Picturing to Learn ของมูลนิธิวิทยาศาสตร์แห่งชาติสหรัฐอเมริกา (http://www.picturingtolearn.org) สอนเราว่าการพยายามสื่อสารข้อมูลและแนวคิดทางวิทยาศาสตร์ด้วยภาพเป็นการเปิดเส้นทางสู่ความเข้าใจ เมื่อนักศึกษาวิทยาศาสตร์และการออกแบบร่วมมือกัน แรงผลักดันในการทำความเข้าใจแนวคิดของกันและกันจะผลักดันให้พวกเขาสร้างวิธีใหม่ในการมองเห็นวิทยาศาสตร์ การลงทุนในการฝึกอบรมการสื่อสารด้วยภาพสำหรับนักวิทยาศาสตร์รุ่นเยาว์จะส่งผลดีต่อระเบียบวินัยที่เน้นข้อมูลมาก

นิสัยที่ฝังแน่นของนักวิทยาศาสตร์ที่ได้รับการฝึกฝนมาอย่างดีทำให้พวกเขาไม่ค่อยชอบการผจญภัยเท่าคนรุ่นใหม่เหล่านี้ เราคิดว่าเราอยู่บนเส้นทางสู่ความเข้าใจอย่างถ่องแท้เมื่อการแรเงาเผยให้เห็นโครงร่างในการเรนเดอร์ 3 มิติ หรือเมื่อการระเบิดของสีแดงปรากฏขึ้นบนแผนที่ความร้อน เป็นต้น แต่อัลกอริธึมที่ใช้ในการผลิตกราฟิกอาจสร้างภาพลวงตาหรือฝังสมมติฐาน ระบบการมองเห็นของมนุษย์สร้างความเข้าใจที่ชัดเจนเกี่ยวกับสิ่งที่รูปภาพแสดงขึ้นในสมอง ไม่จำเป็นต้องเป็นภาพของวิทยาศาสตร์ที่อยู่เบื้องล่าง เว้นแต่เราจะรู้ขั้นตอนทั้งหมดตั้งแต่สมมติฐานจนถึงความเข้าใจ — โดยการสนทนากับนักทฤษฎี นักทดลอง ผู้พัฒนาเครื่องมือและซอฟต์แวร์ นักวิทยาศาสตร์ด้านการแสดงภาพ ศิลปินกราฟิก และนักจิตวิทยาด้านความรู้ความเข้าใจ เราไม่สามารถแน่ใจได้ว่าการแสดงผลนั้นถูกต้องหรือทำให้เข้าใจผิด

โอกาสและความเสี่ยงที่ยิ่งใหญ่ที่สุดอยู่ในขั้นตอนสุดท้ายในเส้นทาง นั่นคือ ความเข้าใจ ไม่ว่าจะด้วยวาจาหรือภาพ ภาษาใด ๆ ที่อ่านไม่ออกและไม่สอดคล้องกันล้มเหลวในการทำงาน Let’s