ที่มาและความสำคัญของโครงการ
ในโลกปัจจุบันที่เต็มไปด้วย Data มหาศาล การเข้าใจ Data และนำมาวิเคราะห์ เพื่อให้เกิดประโยชน์ในการตัดสินใจ หรือวางแผนอนาคตได้ ซึ่ง Data Science เป็นวิชาที่นำเอาความรู้จากหลากหลายด้านมาผสมกันทั้ง ความรู้พื้นฐานตามสายงานต่าง ๆ (เช่น วิศวกรรม, การเงิน, HR), สถิติ, และการเขียนโปรแกรม มาใช้ในการวิเคราะห์ข้อมูลให้ดียิ่งขึ้น ทางกลุ่ม ปตท. จึงได้มีโครงการพัฒนาบุคลากรเพื่อให้มีความรู้ความสามารถด้านการวิเคราะห์ข้อมูล ตั้งแต่ปี 2019 ซึ่งมีนักเรียนที่จบจากโครงการมากกว่า 200 คน และพัฒนา Data Science Project ไปมากกว่า 50 โครงการ คิดเป็น Potential Benefit มากกว่า 500 ล้านบาท ซึ่งในปี 2021 เนื้อหาได้รับการพัฒนามาเป็น eLearning (Video online) รวมกับ Recap-workshop (Live online) ในโครงการเรียนการสอน ซึ่งเนื้อหาการเรียนการสอนจะเน้นการใช้งานอุตสาหกรรมเป็นหลัก
เพื่อเสริมความรู้การวิเคราะห์ข้อมูลให้แก่สังคม VISTEC จะมีการเผยแพร่สู่สาธารณะให้กับผู้อื่นสามารถเข้ามาเรียน โดยเนื้อหาจะมีหมด 3 Parts ดังนี้
Part1: Data Manipulation
Part 2: Data Modeling
Part 3: Advanced Data Modeling
Part 1: Data Manipulation
ใน Part นี้จะเป็นพื้นฐานการทำ Data Science Project โดยเราจะดูภาพรวมของ Data Science และฝึกวิเคราะห์ข้อมูลแบบง่ายๆ โดยผ่านการเขียนโค้ดภาษา Python ซึ่งผู้เรียนไม่จำเป็นต้องมีประสบการณ์มาก่อน โดยหลังจบ Part นี้จะสามารถจัดการข้อมูล และหา Insight จากข้อมูลผ่านการทำ Manipulation และ Visualization ได้
eLearning ใน Part นี้ จะมีทั้งหมดมี 4 วิชาหลักดังนี้
ชื่อวิชา | เวลาในการดู Video (ชั่วโมง) | เวลาในการเรียน(ชั่วโมง) | Link |
---|---|---|---|
Introduction to Data Science | 0.6 | 1 | 1. Introduction to Data Science |
Basic Coding with Python | 4.2 | 8 | 1. Basic Coding with Python |
Mathematics for Data Science (มี 4 วิชาย่อย) |
15.4 | 22 | 1. Basic Probability 2. Basic Statistics 3. Basic Linear Algebra 4. Basic Calculus |
Data Manipulation in Python | 4.5 | 8 | 1. Data Manipulation in Python |
Data Visualization with Python | 0.6 | 1.5 | 1. Data Visualization with Python |
Part 2: Data Modeling
ใน Part นี้จะเป็นทำ Machine Learning หรือว่าการเรียนรู้ของเครื่องโดยใช้ภาษา Python ซึ่งเนื้อหาจะเน้นไปทางการนำไปใช้งานในอุตสาหกรรม โดยเราจะเรียนตั้งแต่ Model ง่าย ๆ เพื่อทำความเข้าใจหลักการของ Machine Learning จนไปถึง Model ที่มีความซับซ้อนมากขึ้น เพื่อได้ Model ที่เก่งมากขึ้น นอกจากนี้ยังมีเนื้อหาเกี่ยวกับ Model Evaluation และ Model Validation เพื่อเป็นการตรวจสอบความสามารถของโมเดล
eLearning ใน Part นี้ จะมีทั้งหมดมี 4 วิชาหลักดังนี้
ชื่อวิชา | เวลาในการดู Video (ชั่วโมง) | เวลาในการเรียน(ชั่วโมง) | Link |
---|---|---|---|
Basic Machine Learning | 4.2 | 8 | 1. Basic Machine Learning 2. Model Evaluation |
Supervised Machine Learning | 6.5 | 11 | 1. Supervised Machine Learning Part 1 2. Supervised Machine Learning Part 2 3. Model Validation |
Unsupervised Machine Learning | 2.4 | 5.5 | 1. Unsupervised Machine Learning |
Model Deployment (Intro) | 0.5 | 1 | 1. Model Deployment |
Part 3: Advanced Data Modeling
ใน Part นี้จะเป็นทำ Deep Learning ซึ่งเป็น Machine Learning ชนิดนึงที่ให้ผลลัพธ์ของโมเดลที่ดีมาก และยังนำไปใช้ในโจทย์เฉพาะทางได้เป็นอย่างดีเช่น Computer Vision หรือ NLP นอกจากนี้ยังมีหัวข้อเกี่ยวกับ Optimization เพื่อช่วยให้เราสามารถสร้าง Optimization Model เพื่อหาจุดที่ดีที่สุดภายใต้ข้อจำกัดต่าง ๆ เพื่อเพิ่มประสิทธิภาพงานของเรา
เนื้อหาส่วนนี้จะเผยแพร่ในกลางปี 2022