รีวิวการสอบ GCP Data practitioner certification ตอนที่ยังเป็น Beta อยู่

New Certification from Google Cloud Platform?
Google cloud platform ได้ประกาศให้มีใบรับรองตัวใหม่ในระดับ Associate ซึ่งก็คือ Data practitioner โดยเป็นการทำขึ้นมาเพื่อทดสอบความรู้เกี่ยวกับการใช้ GCP ด้าน Data ซึ่งก็หมายถึงบริการด้าน Data platform, ETL, ELT รวมไปถึง Database ด้วย เนื่องด้วย Certification ของ GCP นั้นจะมีค่อนข้างเยอะในระดับ Professional ต่างจาก Cloud เจ้าอื่นๆที่มีแต่ละระดับในจำนวนที่พอๆกัน ทำให้ทาง GCP มองเห็นว่าจะต้องเพิ่ม Certification ในระดับ Associate เพิ่มขึ้นมาเพื่อลดช่องว่างตรงนี้ขึ้น

ซึ่งในการสอบ Beta นั้นเขาจะให้มา 2.30 ชั่วโมง กับ 73 ข้อสอบ แลกกับราคาสอบที่ถูกลงถึง 40% แต่เดี๋ยวตอนที่หมด Beta แล้วข้อสอบจะเหลือประมาณ 50 ข้อเท่านั้น และ ผลข้อสอบจะออกหลังจากที่หมด Beta ไปแล้วประมาณต้นธันวาคม ผลสอบที่ได้ก็ : ยังไม่ทราบ
Before taking an exam, what should you know?
เราควรจะรู้เกี่ยวกับอะไรบ้างเพื่อสอบ Certification นี้ ผมแบ่งเป็น 5 อย่างนี้เพื่อที่จะได้เข้าใจได้ง่ายขึ้น
- ETL ELT และ Data pipeline คืออะไร และมี service อะไรบ้าง? เป็นการมีความรู้ด้าน ETL ( Extract Transform Load) ในที่นี้ก็จะมีบริการเช่น Dataflow, Datafusion, Dataprep หรือแม้กระทั่งการเขียน python script ใน Cloud run function, ELT ( Extract Load Transform) เป็นการเก็บข้อมูลก่อนที่จะทำการ transform บริการที่มีให้ใช้ก็พวก Dataform (คล้ายๆ DBT แต่เป็นส่วนประกอบระหว่าง SQL และ Javascript) หลักๆก็ประมาณนี้ อาจจะรวมไปถึง Orchestrate tool ด้วยเช่น Cloud composer (Managed Airflow)
- Bigquery อันนี้ต้องยอมจริงๆเป็น บริการหลักเลยที่ต้องทำความเข้าในการสอบมีทั้งการถามเกี่ยวกับ Google SQL syntax หรือ การทำ partition ต่างๆ ซึ่งมีคำถามเยอะเหมือนกัน
- Machine learning GenAI อันนี้มีถามด้วยแต่ไม่ได้เยอะมาก และเป็นการถามไม่ได้ลงลึกมากเช่น จะใช้ Bigquery ML ยังไง เอาข้อมูลเข้าไปใช้ที่ Auto ML ได้ยังไง และต้องรู้พื้นฐาน ML ด้วยอย่างน้อยรู้ว่า Regression Classification Clustering คืออะไร
- Data security จะมีถามเกี่ยวกับ Role ที่ต้องใช้กับงาน Data อย่างเช่น อยากให้ user แก้ไขข้อมูลใน Bigquery ไม่ได้ ก็ต้องมอบสิทธิ์เป็น Data viewer และ Job user เท่านั้น และ พวก Encryption Key, AEAD encryption เป็นต้น
- Looker studio and Looker (Google core) อันนี้เราต้องแยกให้ออกระหว่าง Looker studio ที่เป็นตัวฟรี และ Looker ที่เป็นตัวเสียเงิน จะมีคำถามเกี่ยวกับการใช้ LookerML (Looker syntax) ไปไม่เป็นเหมือนกันตัวผู้เขียน😅 ไม่ค่อยได้ใช้
ดู exam guide เพิ่มเติมแบบละเอียดได้ที่: https://services.google.com/fh/files/misc/associate_data_practitioner_exam_guide_english.pdf
ข้อคิดเห็นส่วนตัวเกี่ยวกับการสอบนี้
ข้อสอบถึงจะเป็นระดับ Associate แต่ก็ต้องมีความรู้เกี่ยวกับ Service ของ GCP มากพอตัวอยู่เหมือนกัน และด้วยความที่ชื่อ Cert บอกว่าเป็น Data practitioner เท่ากับเราต้องรู้เกี่ยวกับ Data เกือบครบวงจรเลย ตั้งแต่ Ingest ไปถึง Machine learning ขั้นต้น กับ การขึ้น Dashboard ทำให้ความรู้สึกผมคือ Cert ใบนี้ ความยากอยู่ในระดับน้องๆ Cert Google Professional Data engineer เลย ถ้าถามว่าอันนี้เหมาะกับใคร ก็คงเหมาะกับคนที่เพิ่งทำความรู้จักกับ GCP และอยู่ในสายงาน Data อาจจะเป็น DE, DA, DS หรือแม้กระทั่ง PM ที่ต้องดูแล Data project ก็ดี
สุดท้ายไม่ว่าจะผ่านหรือไม่ผ่านยังไง แต่คนที่ได้ทำอย่างน้อยก็ได้เรียนรู้ครับ😊
Leave a comment