วิชาเทคโนโลยี 5/6 B2
โรงเรียนท่ามะกาวิทยาคม
วันพุธที่ 28 ตุลาคม พ.ศ. 2563
วันพุธที่ 21 ตุลาคม พ.ศ. 2563
วันพุธที่ 26 สิงหาคม พ.ศ. 2563
วิทยาการข้อมูล หรือ Business Analytics นั้นเมื่อวาดออกมาเป็น Venn-Euler Diagram หรือแผนภาพเวนน์-ออยเลอร์นั้นประกอบด้วยสามสาขาวิชาเป็นการบูรณาการของสามสาขาวิชา คือ 1. วิทยาการคอมพิวเตอร์ (Computer Sciences) 2. คณิตศาสตร์และสถิติศาสตร์ และ 3. ความเชี่ยวชาญในเนื้อหาวิชาแต่ละสาขาวิชา ซึ่งถ้าเป็น Business Analytics แล้วก็จะเป็นเนื้อหาในส่วนของการบริหารธุรกิจ
ความรู้ทางวิทยาการคอมพิวเตอร์ล้วนๆ ถือว่าเป็น Hacking Skills ความรู้ทางสถิติและคณิตศาสตร์เพื่อนำมารวมกับ Hacking Skills ที่ว่าก็เป็นเรื่องของการเรียนรู้ของเครื่องจักร (Machine learning) ส่วน Hacking Skills บวกกับความเชี่ยวชาญเฉพาะเนื้อหาถือว่าเป็น dangerous zone โดยเฉพาะอย่างยิ่งมีความรู้ในเนื้อหานั้นๆ แล้วเอาความรู้ทางวิทยาการคอมพิวเตอร์มาบิดข้อมูลไปมา จนเกิดอันตรายได้ เรียกว่า มีความรู้เพียงพอที่จะก่อให้เกิดอันตรายหรือ know enough to be dangerous ในขณะที่ถ้ารู้สถิติและคณิตศาสตร์รวมกับความเชี่ยวชาญในเนื้อหาก็จะเป็น Traditional research เช่น รู้สถิติและการตลาด เป็นวิจัยตลาด รู้เรื่องบริหารธุรกิจและสถิติกับคณิตศาสตร์ก็จะเป็นวิจัยธุรกิจ เป็นต้น หากมีความรู้ทั้งสามอย่างคือรู้ทั้งสถิติและคณิตศาสตร์ วิทยาการคอมพิวเตอร์ และเนื้อหาที่ตนเชี่ยวชาญก็จะเป็นวิทยาการข้อมูล
ความแตกต่างหลักระหว่างวิทยาการข้อมูลกับวิจัยแบบดั้งเดิม เช่น ความแตกต่างระหว่างการวิจัยการตลาดแบบดั้งเดิม (Traditional marketing research) และการวิเคราะห์การตลาด (Marketing Analytics) นั้นแตกต่างกันตรงที่ความรู้ทางวิทยาการคอมพิวเตอร์ ความรู้ทางวิทยาการคอมพิวเตอร์นั้นหมายรวมถึงการใช้ข้อมูลจากระบบสารสนเทศที่หลากหลายขึ้น Big data, ข้อมูลโลกออนไลน์, social network and media, Barcode scanner, Biocensor, และ Internet of Things และหากจะต้องการเป็น Business Analytics หรือ Marketing Analytics ได้ แตกต่างจาก Traditional Business Research หรือ Traditional Marketing Research ต้องบูรณาการความรู้ทางวิทยาการคอมพิวเตอร์ เข้ามา
การนำความรู้ทางวิทยาการคอมพิวเตอร์เข้ามานั้น มาในสองรูปแบบหลัก อย่างแรกคือ ช่องทางในการเข้าถึงข้อมูล ข้อมูลขนาดใหญ่ในโลกปัจจุบันเป็นข้อมูลแบบไม่มีโครงสร้าง (Unstructured data) เช่น พฤติกรรมการท่องเว็บไซท์ทางอินเตอร์เน็ต จะเอามาใส่ตารางแบบแต่ก่อนในรูปแบบของ Relational database ก็ทำไม่ได้ เราเป็นเพื่อนกับใคร เราแชร์ เราคอมเมนต์ เรากดไลค์ เรา retweet ให้ใครใคร retweet ต่อจากเราบ้าง เราซื้อสินค้าอะไรบนโลกออนไลน์ มันเชื่อมโยงกันแบบวุ่นวายไปหมด ไม่มี pattern ที่แน่นอน หรือกระทั่งการซื้อของแล้ว Scan barcode ในร้านสะดวกซื้อหรือร้านค้าปลีก ก็มี format ที่กระจุยกระจายมาก เพราะในร้านมี stock keeping unit: SKU เยอะมาก และมีรายการสินค้าเพิ่มหรือลดตลอดเวลา ข้อมูลเหล่านี้ เป็นบ่อน้ำมันให้เราขุดมาใช้งาน ซึ่งการวิจัยธุรกิจหรือการวิจัยตลาดแบบดั้งเดิมนั้นทำไม่ได้พอ แค่จะดึงข้อมูลก็ลำบากกว่า ข้อมูลพฤติกรรมการใช้อินเตอร์เน็ทของประเทศไทยก็ไม่มีความจำเป็นที่ต้องทำสำรวจด้วยตัวอย่าง (Sample survey) อย่างที่สำนักงานสถิติแห่งชาติทำแบบดั้งเดิม เพราะสามารถไปเก็บข้อมูล log file จาก gateway ของ กสทช ซึ่งเป็น hard data และไม่ใช่คำรายงานด้วยตนเองจึงไม่มีการโกหกเพราะ track ได้จากพฤติกรรมที่คนไทยใช้อินเตอร์เน็ตจริงๆ ไม่มีความคลาดเคลื่อนจากการสุ่มตัวอย่าง (Sampling error) เพราะเก็บมาจากประชากรทั้งหมดคือคนไทยทั้งประเทศ จึงมีความแม่นยำมากกว่า มีต้นทุนที่ถูกกว่า ใช้เวลาน้อยกว่าเพราะเป็น secondary data จะเห็นว่าในกรณีนี้การสำรวจด้วยตัวอย่างไม่มีความจำเป็น การใช้สถิติเชิงอนุมาน (Statistical inference) ที่เราเรียนมากันมากมายก็ไม่มีความจำเป็นเช่นกัน แต่ความรู้เรื่อง Big Data Architecture นั้นจำเป็น
ประการที่สองเนื่องจากข้อมูลขนาดใหญ่สมัยใหม่ มีความรวดเร็ว (Velocity) และมีความหลากหลาย (Variety) ข้อมูลวิจัยธุรกิจและวิจัยตลาดแบบเดิมๆ ส่วนใหญ่เป็นข้อมูลตัวเลขหรือข้อความ (ในสัดส่วนที่ไม่มากนัก) และวิธีการทางสถิติศาสตร์ก็พัฒนามาเพื่อการวิเคราะห์ได้เฉพาะข้อมูลที่มีโครงสร้าง (Structured data) ที่เป็นข้อมูลตัวเลขเป็นหลัก แต่ข้อมูลขนาดใหญ่ มีข้อความ มี social network behavior มีภาพ มีเสียง มีวีดีโอ มีภาพสามมติ มีวีดีโออนิเมชั่นสามมิติ ข้อมูลมีความซับซ้อนเกินกว่าความสามารถของสถิติศาสตร์แบบดั้งเดิมจะวิเคราะห์ได้ ในขณะที่การเรียนรู้ของเครื่องจักร ปัญญาประดิษฐ์ (Artificial Intelligence) และ deep learning ถูกออกแบบมาให้วิเคราะห์ข้อมูลไม่มีโครงสร้าง (Unstructured data) ที่ซับซ้อนกว่าได้ หากสถิติศาสตร์ไม่ปรับตัวพัฒนาตัวเองให้ตามทันก็อาจจะล้าหลังกว่าได้ในอนาคตอันใกล้ มองในอีกแง่หนึ่ง Machine learning หรือ deep learning เหล่านั้นทำหน้าที่เสมือนหนึ่งสถิติเชิงบรรยาย (Descriptive statistics) เพราะไม่ได้คำนึงถึงความคลาดเคลื่อนจากการสุ่มและการแจกแจง (Distribution) ของตัวแปรมากนัก
Big Data คือ สำคัญอย่างไรในยุคปัจจุบัน ?
ig Data (บิ๊ก ดาต้า) คือ
Big Data คือ ?? | ในยุคปัจจุบันที่โลกและธุรกิจกำลังถูกขับเคลื่อนด้วยข้อมูลจำนวนมหาศาล จนทำให้คำว่า Big Data มีผู้คนสนใจและเป็น Trend ที่กำลังมามาแรงอย่างมาก และเชื่อว่าหลายๆ คนที่ทำงานอยู่ในวงการไอที หรือสายงานอื่นๆก็ตาม ก็คงได้ยินคำว่า Big Data ผ่านหูกันมาบ้างแล้ว เคยเกิดความสงสัยกันบ้างไหมว่า Big data มันคืออะไร วันนี้เราจะมาหาคำตอบกันในรูปแบบที่เข้าใจได้ง่ายๆ กันครับ
Big Data คือ
บิ๊กดาต้า (Big Data) คือคำนิยามของข้อมูลที่มีขนาดใหญ่ทุกชนิดที่อยู่ในองค์กรของเราไม่ว่าจะเป็น ข้อมูลบริษัท ข้อมูลลูกค้า Suppliers พฤติกรรมผู้บริโภค Transaction ไฟล์เอกสารต่างๆที่เกี่ยวข้องทั้งหมด รวมไปจนถึง รูปภาพ URLs ลิงค์ต่างๆที่คุณเก็บไว้ ฯลฯ ที่มีปริมาณมากจนกระทั่งซอฟต์แวร์ปกติทั่วไปไม่สามารถรองรับการเก็บข้อมูลหรือประมวลผลได้อย่างเต็มประสิทธิภาพ
ซึ่งอีกนัยนึง Big Data คือเทคโนโลยีและสถาปัตยกรรมหรือ Platform ไอทีรุ่นใหม่ ซึ่งอาจมาในรูปแบบซอฟต์แวร์ ที่สามารถรองรับการจัดเก็บ การจัดการ กรองเลือกข้อมูล การวิเคราะห์ แสดงผล และการใช้งานข้อมูลที่มีคุณลักษณะดังต่อไปนี้
คุณลักษณะของ Big Data (4V)
- ที่มีปริมาณมาก (Volume) ปัจจัยข้อแรกแน่นอนว่าคำว่า Big Data มีคำว่า “Big” นั่นก็คือข้อมูลที่มีขนาดใหญ่ ซึ่งสามารถเป็นได้ทั้งรูปแบบ Online และ Offline ซึ่งส่วนมากแล้วจะมีปริมาณมากกว่าหน่วย TB (Terabyte) ขึ้นไป
- มีการเปลี่ยนแปลงอย่างรวดเร็ว (Velocity) ส่งผ่านข้อมูล Update กันอย่างต่อเนื่อง (Real-time) จนทำให้การวิเคราะห์ง่ายๆแบบ Manual เกิดข้อจำกัด หรือไม่สามารถจับรูปแบบหรือทิศทางของข้อมูลได้
- หลากหลายประเภทหรือแหล่งที่มา (Variety) หมายถึงรูปแบบของข้อมูลที่แตกต่างกันออกไป ทั้งในรูปแบบ ตัวอักษร วิดีโอ รูปภาพ ไฟล์ต่างๆ ฯลฯ และหลากหลายแหล่งที่มาเช่น Social Network หรือ Platform E- Commerce ต่างๆ
- ยังไม่ผ่านการประมวลผล (Veracity) ยังไม่ผ่านการ Process ให้อยู่ในรูปแบบของข้อมูลดิบ (Raw Data) ที่สามารถใช้สร้างประโยชน์ต่อองค์กรได้
ซึ่งข้อมูลเหล่านี้ที่มีคุณลักษณะข้างต้นนี้ ในอดีตที่ผ่านมายังไม่มีเครื่องมือมารองรับและจัดการ หรือยังไม่เคยนำมารวมกันเพื่อตั้งโจทย์ที่เป็นประโยชน์กับธุรกิจ ค้นหาผลลัพธ์ และผ่านกระบวนการวิเคราะห์ข้อมูลและดูความสัมพันธ์กันด้วยเครื่องมือที่เหมาะสม เพื่อให้เกิดเป็นข้อมูลที่สามารถใช้งานได้จริง (Information) และเกิดประโยชน์กับธุรกิจ เมื่อบริษัทมีข้อมูลที่พร้อมและมีประโยชน์ ทำให้กระบวนการตัดสินใจของผู้บริหารมีความถูกต้องและแม่นยำมากขึ้น
Big Data ช่วยให้คุณสามารถใช้ข้อมูลจากทุกแหล่งที่เป็นไปได้ และวิเคราะห์เพื่อให้ได้ผลลัพธ์ที่คุณต้องการ ซึ่งช่วยให้คุณสามารถเข้าใจผู้บริโภคได้มากขึ้น (Customer Insight) ลดต้นทุนได้ ลดเวลาระยะเวลาดำเนินการ และสามารถตัดสินใจได้อย่างแม่นยำมากขึ้น
อ้างอิง:
สำนักส่งเสริมเศรษฐกิจดิจิทัล (DEPA)
กำลังโหลด…
-
Big Data คือ สำคัญอย่างไรในยุคปัจจุบัน ? ig Data (บิ๊ก ดาต้า) คือ Big Data คือ ?? | ใ นยุคปัจจุบันที่โลกและธุรกิจกำลังถูกขับเคลื่อนด้วย...
-
กำลังโหลด…
-
กำลังโหลด…


