โครงการ Knowledge Transfer Self-learning

เนื้อหาความรู้พื้นฐานการเขียนโปรแกรม มาใช้ในการวิเคราะห์ข้อมูลให้ดียิ่งขึ้น

v1.0 21 Dec 2021
knowledge

ที่มาและความสำคัญของโครงการ

ในโลกปัจจุบันที่เต็มไปด้วย Data มหาศาล การเข้าใจ Data และนำมาวิเคราะห์ เพื่อให้เกิดประโยชน์ในการตัดสินใจ หรือวางแผนอนาคตได้ ซึ่ง Data Science เป็นวิชาที่นำเอาความรู้จากหลากหลายด้านมาผสมกันทั้ง ความรู้พื้นฐานตามสายงานต่าง ๆ (เช่น วิศวกรรม, การเงิน, HR), สถิติ, และการเขียนโปรแกรม มาใช้ในการวิเคราะห์ข้อมูลให้ดียิ่งขึ้น ทางกลุ่ม ปตท. จึงได้มีโครงการพัฒนาบุคลากรเพื่อให้มีความรู้ความสามารถด้านการวิเคราะห์ข้อมูล ตั้งแต่ปี 2019 ซึ่งมีนักเรียนที่จบจากโครงการมากกว่า 200 คน และพัฒนา Data Science Project ไปมากกว่า 50 โครงการ คิดเป็น Potential Benefit มากกว่า 500 ล้านบาท ซึ่งในปี 2021 เนื้อหาได้รับการพัฒนามาเป็น eLearning (Video online) รวมกับ Recap-workshop (Live online) ในโครงการเรียนการสอน ซึ่งเนื้อหาการเรียนการสอนจะเน้นการใช้งานอุตสาหกรรมเป็นหลัก

เพื่อเสริมความรู้การวิเคราะห์ข้อมูลให้แก่สังคม VISTEC จะมีการเผยแพร่สู่สาธารณะให้กับผู้อื่นสามารถเข้ามาเรียน โดยเนื้อหาจะมีหมด 3 Parts ดังนี้

Part1: Data Manipulation

Part 2: Data Modeling

Part 3: Advanced Data Modeling


Part 1: Data Manipulation

ใน Part นี้จะเป็นพื้นฐานการทำ Data Science Project โดยเราจะดูภาพรวมของ Data Science และฝึกวิเคราะห์ข้อมูลแบบง่ายๆ โดยผ่านการเขียนโค้ดภาษา Python ซึ่งผู้เรียนไม่จำเป็นต้องมีประสบการณ์มาก่อน โดยหลังจบ Part นี้จะสามารถจัดการข้อมูล และหา Insight จากข้อมูลผ่านการทำ Manipulation และ Visualization ได้

eLearning ใน Part นี้ จะมีทั้งหมดมี 4 วิชาหลักดังนี้

ชื่อวิชา เวลาในการดู Video (ชั่วโมง) เวลาในการเรียน(ชั่วโมง) Link
Introduction to Data Science 0.6 1 1. Introduction to Data Science
Basic Coding with Python 4.2 8 1. Basic Coding with Python
Mathematics for Data Science
(มี 4 วิชาย่อย)
15.4 22 1. Basic Probability
2. Basic Statistics
3. Basic Linear Algebra
4. Basic Calculus
Data Manipulation in Python 4.5 8 1. Data Manipulation in Python
Data Visualization with Python 0.6 1.5 1. Data Visualization with Python


Part 2: Data Modeling

ใน Part นี้จะเป็นทำ Machine Learning หรือว่าการเรียนรู้ของเครื่องโดยใช้ภาษา Python ซึ่งเนื้อหาจะเน้นไปทางการนำไปใช้งานในอุตสาหกรรม โดยเราจะเรียนตั้งแต่ Model ง่าย ๆ เพื่อทำความเข้าใจหลักการของ Machine Learning จนไปถึง Model ที่มีความซับซ้อนมากขึ้น เพื่อได้ Model ที่เก่งมากขึ้น นอกจากนี้ยังมีเนื้อหาเกี่ยวกับ Model Evaluation และ Model Validation เพื่อเป็นการตรวจสอบความสามารถของโมเดล

eLearning ใน Part นี้ จะมีทั้งหมดมี 4 วิชาหลักดังนี้

ชื่อวิชา เวลาในการดู Video (ชั่วโมง) เวลาในการเรียน(ชั่วโมง) Link
Basic Machine Learning 4.2 8 1. Basic Machine Learning
2. Model Evaluation
Supervised Machine Learning 6.5 11 1. Supervised Machine Learning Part 1
2. Supervised Machine Learning Part 2
3. Model Validation
Unsupervised Machine Learning 2.4 5.5 1. Unsupervised Machine Learning
Model Deployment (Intro) 0.5 1 1. Model Deployment


Part 3: Advanced Data Modeling

ใน Part นี้จะเป็นทำ Deep Learning ซึ่งเป็น Machine Learning ชนิดนึงที่ให้ผลลัพธ์ของโมเดลที่ดีมาก และยังนำไปใช้ในโจทย์เฉพาะทางได้เป็นอย่างดีเช่น Computer Vision หรือ NLP นอกจากนี้ยังมีหัวข้อเกี่ยวกับ Optimization เพื่อช่วยให้เราสามารถสร้าง Optimization Model เพื่อหาจุดที่ดีที่สุดภายใต้ข้อจำกัดต่าง ๆ เพื่อเพิ่มประสิทธิภาพงานของเรา

เนื้อหาส่วนนี้จะเผยแพร่ในกลางปี 2022