ปฎิเสธไม่ได้ว่าปัจจุบันเทคโนโลยีเข้ามามีบทบาทในชีวิตประจำวันของเรามากขึ้นเรื่อยๆ ด้วยความที่เทคโนโลยีช่วยอำนวยความสะดวกสบายให้เรามากยิ่งขึ้น ไม่ว่าจะเป็นการมี Chatbot สำหรับตอบข้อความลูกค้าตลอด 24 ชั่วโมงโดยไม่จำเป็นต้องใช้แรงงานคนมาตอบข้อความ
และยิ่งในปัจจุบันที่เทคโนโลยีก็พัฒนามาไกลจนขนาดที่เราสามารถพูดคุยโต้ตอบกับโมเดลภาษาขนาดใหญ่ที่สามารถช่วยเราวิเคราะห์บริบทต่างๆ แปลภาษา รวมถึงหาข้อมูลที่เราต้องการได้ในแพลตฟอร์มเดียว
หลายคนอาจจะเคยใช้งาน AI ในการทำงาน เช่น ChatGPT กันมาบ้างแล้ว แต่บทความนี้จะพามารู้จัก Gemini โมเดล AI สุดล้ำจาก Google ที่สามารถช่วยให้การทำงานของเราเป็นไปได้อย่างมีประสิทธิภาพ สะดวก และรวดเร็วขึ้น พร้อมบอกข้อดี ข้อเสียที่คุณอาจไม่เคยรู้มาก่อน ครบ จบ ในที่เดียว!
ยาวไป อยากเลือกอ่าน?
Gemini คืออะไร
Gemini (เดิมชื่อ Bard) คือ ตระกูลโมเดลภาษาขนาดใหญ่ (LLMs) ที่พัฒนาโดย Google โดยความสามารถหลักๆ ของ Gemini คือการประมวลผลภาษา เสียง และโค้ด เปรียบเสมือนปัญญาประดิษฐ์ (AI) ที่สามารถสนทนาโต้ตอบกับมนุษย์ได้อย่างเป็นธรรมชาติ ผ่านการใช้การประมวลผลภาษาธรรมชาติ (Natural Language Processing) และ Machine Learning
Google เปิดตัว Bard ในเบื้องต้นเมื่อเดือน มีนาคม 2023 ในลักษณะของ “เฟสทดลอง”
โดยการเปิดตัวอย่างเป็นทางการต่อสาธารณะนั้น จำกัดเฉพาะผู้ใช้งานในสหรัฐอเมริกาและสหราชอาณาจักรเท่านั้น ผู้ใช้จะต้องลงทะเบียนเพื่อรอคิว ภายหลังจากนั้น ในเดือนพฤษภาคม 2023 มีการประกาศเปิดตัว Bard ในระดับสากล ต่อมา Google เปลี่ยนชื่อ Bard เป็น Gemini เมื่อวันที่ 8 กุมภาพันธ์ 2024 โดยระบบ Gemini คือระบบ LLM ที่เคยใช้ขับเคลื่อน Bard อยู่แล้ว ปัจจุบัน Gemini รองรับการใช้งาน 40 ภาษา และครอบคลุม 230 ประเทศ
Gemini ทำงานอย่างไร
Gemini อาศัยเทคนิคย่อยของ Machine Learning ที่เรียกว่า โมเดลภาษาขนาดใหญ่ (LLM) โดย LLM จะมีความสามารถในการนำเข้าและวิเคราะห์ข้อมูลจำนวนมหาศาลได้อย่างมีประสิทธิภาพ ซึ่งข้อมูลดังกล่าวนี้ก็ดึงมาจากแหล่งข้อมูลอื่นๆ เช่น บริการต่างๆ ของ Google พูดง่ายๆ คือ LLM เรียนรู้ผ่าน “การอ่าน” คำนับล้านล้านคำเพื่อช่วยให้เข้าใจรูปแบบที่ประกอบกันเป็นภาษา จึงสามารถเข้าใจและตอบคำถามของเราในรูปแบบภาษาทั่วไปได้ ซึ่ง Gemini เรียนรู้จากคำสั่งที่เราป้อนไป คำตอบต่างๆ และความคิดเห็นของเราด้วย บางครั้ง Gemini จึงอาจมีข้อผิดพลาดและตอบคำถามที่ไม่เหมาะสมได้
Gemini ใช้งานได้ฟรีไหม
Google เปิดให้ใช้งาน Gemini ทั้งในแบบฟรีและแบบเสียค่าบริการ เราสามารถเข้าถึง Gemini ได้ผ่านเว็บไซต์ หรือแอปพลิเคชันบนมือถือ iOS และ Android
ฟีเจอร์พื้นฐาน ฟรีสำหรับทุกคน
- การป้อนคำสั่งและสร้างข้อความ
- สามารถอัปโหลดและสร้างรูปภาพ
- สามารถค้นหาข้อมูลภายในแอปพลิเคชันและบริการต่างๆ ของ Google
Gemini Advanced แบบเสียค่าบริการ
- โมเดล AI ขั้นสูง ออกแบบมาสำหรับงานที่ซับซ้อนมากขึ้น
- สามารถสนทนาได้ยาวขึ้น
- สามารถใช้งาน Gemini ร่วมกับแอปพลิเคชันอื่นๆ ของ Google เช่น Gmail และ Docs
- พื้นที่จัดเก็บข้อมูล 2TB
Gemini ใช้ทำอะไรได้บ้าง
Text generation

การป้อนคำสั่ง และพูดคุยกับ Gemini เป็นสิ่งที่คนทั่วไปมักจะใช้งานกัน เมื่อป้อนคำสั่งหรือหัวข้อที่เราต้องการ Gemini จะตอบสนองด้วยคำตอบในรูปแบบของข้อความที่พร้อมนำไปใช้ต่อ เราสามารถระบุเพิ่มไปได้ว่าต้องการรูปแบบภาษาในรูปแบบไหน เช่น ข้อความสำหรับงานธุรกิจ งานส่วนตัว งานวิชาการ หรือแม้แต่งานสร้างสรรค์ ตัวอย่าง Text Generation ได้แก่
- ร่างข้อความสำหรับอีเมล จดหมาย และรูปแบบการติดต่อสื่อสารอื่นๆ
- สร้างคอนเทนต์เพื่อการศึกษา เช่น สุนทรพจน์ งานนำเสนอ และแผนการสอน
- แปลภาษา
- ร่างเอกสารทางธุรกิจ เช่น ข้อเสนอ และคอนเทนต์บนเว็บไซต์
- แนะนำเทคนิคการปรับปรุงคอนเทนต์ที่มีอยู่แล้ว
- เขียนคอนเทนต์สร้างสรรค์ เช่น โพสต์โซเชียลมีเดีย และเนื้อเรื่องสำหรับเกม
Image Analysis

Gemini รองรับการทำงานร่วมกับ Google Lens โดยเราสามารถอัปโหลดรูปภาพเพื่อเพิ่มบริบทให้กับคำสั่งของเรา หรือ สั่งให้ Gemini ดำเนินการบางอย่างกับรูปภาพนั้นได้ เช่น
- อธิบายสิ่งที่ปรากฏอยู่ในรูปภาพ
- เขียนคำบรรยายใต้ภาพ โดยสามารถกำหนดสไตล์หรือความยาวของคำบรรยายได้
- ระบุสิ่งที่ปรากฏในภาพ เช่น ชนิดของดอกไม้ หรือประเภทของแมลง
- แปลงโน้ตที่เขียนด้วยลายมือเป็นข้อความตัวอักษร
- แปลงข้อความจากรูปภาพ เช่น เลขทะเบียนรถให้เป็นข้อความตัวอักษร
ข้อจำกัดของฟีเจอร์นี้คือ ไม่อนุญาตให้อัปโหลดรูปภาพของบุคคล กฎข้อนี้มีขึ้นเพื่อป้องกันการใช้แพลตฟอร์มในการสร้างรูปภาพที่เป็นอันตรายต่อผู้อื่น
Image Generation

Gemini สามารถสร้างรูปภาพตามคำสั่งของเราได้ โดยเรายังสามารถสั่งให้ Gemini ใช้รูปภาพที่อัปโหลดเป็นตัวอย่างได้ เรายังสามารถระบุได้ว่าต้องการให้รูปภาพดูเหมือนภาพถ่าย ภาพวาดลายเส้น หรือภาพวาดสีน้ำมัน Gemini ยังสามารถสร้างรูปในแบบต่างๆ ได้ เช่น
- สร้างภาพสำหรับโซเชียลมีเดีย งานนำเสนอ และเว็บไซต์
- ร่างภาพคอนเซปต์สำหรับโครงการภาพยนตร์ งานศิลปะ ภาพถ่าย หรือประติมากรรม
- เพิ่มภาพประกอบลงในบทความหรือบทกวีที่มีอยู่
- สร้างภาพที่มีอยู่แล้วในสไตล์ที่แตกต่าง
- ระดมความคิดสำหรับการตกแต่ง
Code Writing

Gemini สามารถแปลคำสั่งภาษาธรรมดาเป็นโค้ดได้ โดยเขียนโค้ดได้มากกว่า 20 ภาษา ความสามารถด้านการเขียนโค้ดบางอย่างของ Gemini ได้แก่
- ค้นหาบั๊ก หรือข้อผิดพลาดในโค้ดที่มีอยู่
- ปรับปรุงโค้ดที่มีอยู่ให้ทันสมัย
- อธิบายฟังก์ชันการทำงานของโค้ด
- สร้างเอกสารประกอบโค้ด
- แปลโค้ดระหว่างภาษาโปรแกรมที่ต่างกัน
Brainstorming

Gemini คือผู้ช่วยอัจฉริยะด้านความคิดสร้างสรรค์ที่จะช่วยปั้นไอเดียเจ๋งๆ ได้ โดยสามารถช่วยคุณระดมความคิดสำหรับกิจกรรมต่างๆ มากมาย เช่น
- ไอเดียสำหรับเกมสนุกๆ สำหรับการสร้างทีม การสร้างเครือข่าย หรือกิจกรรมครอบครัว
- คุณลักษณะและฟังก์ชันการทำงานของสินค้าหรือบริการ
- เค้าโครงสำหรับภาพเพื่อประกอบการนำเสนอ โพสต์ในบล็อก หรือโซเชียลมีเดีย
- โจทย์สำหรับการระดมความคิด
- คอนเทนต์สำหรับบล็อก การนำเสนอ โพสต์บนโซเชียลมีเดีย และแคมเปญในอีเมล
- กิจกรรมหรืองานอดิเรกใหม่ๆ ที่ควรลองทำตามความสนใจและทักษะในปัจจุบัน
Searching the Internet

สิ่งที่ทำให้ Gemini โดดเด่นคือความสามารถในการดึงศักยภาพการค้นหาของ Google มาใช้ ความสามารถเหล่านี้สามารถใช้เพื่อค้นหาโดยตรงภายในแอปพลิเคชัน หรือใช้สำหรับทำงานที่ซับซ้อนยิ่งขึ้น
Gemini จะไม่แสดงผลการค้นหาแบบเดียวกับที่เราเห็นในหน้าผลการค้นหาของ Google แต่จะทำการสรุปผลลัพธ์เหล่านั้นแทน บางครั้งคำตอบของ Gemini อาจรวมถึงรูปภาพที่มีลิงก์ ดังนั้นถ้าเราค้นหา “วันหยุดสำคัญในเคนยา” Gemini อาจแสดงผลเป็นรายการวันหยุดและรูปภาพผู้คนที่กำลังเฉลิมฉลอง
เรายังสามารถสั่งให้ Gemini สรุปข้อมูลเพื่อตัดสินใจได้ เช่น ถ้าเรากำลังตัดสินใจว่าจะซื้อโทรทัศน์รุ่นไหน Gemini สามารถสร้างตารางเปรียบเทียบโทรศัพท์แต่ละรุ่นในตารางเดียว เพื่อให้เราไม่ต้องสลับไปมาระหว่างแท็บต่างๆ ได้
Interacting with Google Apps and Services
เราสามารถค้นหาข้อมูลภายในแอปพลิเคชันและบริการอื่นๆ มากมายของ Google เช่น Gmail, Flights, YouTube, Docs, Drive และ Maps ผ่าน Gemini Extensions เช่น
- ค้นหาว่าติดต่อกับเพื่อนร่วมงานเก่าครั้งล่าสุดเมื่อไหร่ และ สรุปเนื้อหาที่เคยพูดคุยกัน
- ค้นหาส่วนผสมและปริมาณที่ระบุไว้ในวิดีโอการทำอาหารบน YouTube
- ค้นหารายชื่อสถานที่ท่องเที่ยวในเมืองที่วางแผนจะไป พร้อมระยะทางและเวลาขับรถเฉลี่ยจากโรงแรม
- สร้างแนวคิดคอนเทนต์ อิงจากหัวข้อที่พูดถึงในเอกสาร Google Doc
- สามารถใช้ Gemini ภายใน Gmail, Docs และ Drive ได้ แต่ต้องเสียค่าบริการ
Summarize Text
Gemini สามารถวิเคราะห์และสรุปข้อความได้ เพียงแค่วางข้อความหรือวาง URL ลิงก์ลงใน Chatbot สามารถใช้งานได้ดังนี้
- สรุปบทความ โดยเน้นประเด็นสำคัญที่น่าสนใจสำหรับผู้อ่านที่มีพื้นฐานทางเทคนิค
- ดึงหัวข้อที่สำคัญที่สุดออกมาจากบันทึกการสัมภาษณ์
- เปรียบเทียบสองบทความ โดยสรุปเนื้อหาโดยรวมของทั้งสองบทความให้อ่านง่ายในรูปแบบตาราง
ข้อดีของ Gemini
ใช้งานร่วมกับบริการของ Google ได้
การค้นหาข้อมูลเที่ยวบิน แผนที่ โรงแรม เอกสาร และที่เก็บข้อมูลภายใน Google ช่วยให้เราสามารถจัดการข้อมูลที่ต้องใช้หลายแท็บได้ในหน้าเดียวโดยไม่ต้องสลับไปมา เช่น การวางแผนงานอีเวนต์ ได้ในหน้าเดียว โดยเราสามารถใช้เทคนิคต่างๆ ด้านล่างเพื่อความสะดวกในการทำงานมากขึ้น เช่น
- ใช้ฟีเจอร์ “Google it” เพื่อตรวจสอบคำตอบของ Gemini แบบเรียลไทม์
- เจาะลึกงานวิจัยมากขึ้นโดยการเยี่ยมชมลิงก์ภายในอินเทอร์เฟซ
- ส่งออกคำตอบของ Gemini ไปยัง Gmail หรือ Google Docs ได้โดยตรง
ข้อมูลอัปเดตแบบเรียลไทม์
เนื่องจาก Gemini ดึงข้อมูลโดยตรงจาก Google จึงทำให้ Gemini รู้ข้อมูลต่างๆ แบบเรียลไทม์ ด้วยความสามารถนี้ เราสามารถถาม Gemini เกี่ยวกับกิจกรรมและหัวข้อที่เกี่ยวข้องในปัจจุบันได้ เช่น
- สร้างภาพที่ได้รับแรงบันดาลใจจากสภาพอากาศวันนี้ในเมืองของเรา
- ขอสรุปข่าวสารล่าสุดในประเทศของเรา
- วิจัยแนวโน้มปัจจุบันเกี่ยวกับหัวข้อที่เปลี่ยนแปลงอย่างรวดเร็ว เช่น Pop Culture และเทคโนโลยี
- ค้นหาว่ามีกฎหมายใหม่ใดที่เพิ่งนำมาใช้ในปีที่ผ่านมา
- ค้นหาว่าใครคือเจ้าหน้าที่ที่มาจากการเลือกตั้งในปัจจุบัน ในระดับเทศบาล รัฐ หรือประเทศ
โต้ตอบได้หลายรูปแบบในแพลตฟอร์มเดียว
Gemini สามารถอ่าน สร้างโค้ด ข้อความ รูปภาพ และเสียง ภายในแอปพลิเคชันเดียว ซึ่งมีประโยชน์หลายอย่าง ได้แก่
- บริบทที่กว้างขึ้นสำหรับคำสั่ง ซึ่งช่วยให้ Gemini เข้าใจความแตกต่าง เช่น อารมณ์ขัน หรือการเสียดสี ที่อาจหายไปจากคำสั่งที่เป็นข้อความเท่านั้น
- การโต้ตอบที่เป็นธรรมชาติมากขึ้น เนื่องจากสามารถบอกให้แพลตฟอร์มดูรูปภาพหรือดูวิดีโอ แทนที่จะพยายามอธิบายด้วยตัวเอง
- คำสั่งหลายขั้นตอน เช่น การขอให้ Gemini เขียนโพสต์โซเชียลมีเดีย และสร้างภาพประกอบ
ข้อเสียของ Gemini
ความไม่แม่นยำ
คำตอบของ Gemini อาจไม่แม่นยำเสมอไป ในแวดวงปัญญาประดิษฐ์ สิ่งเหล่านี้เรียกว่า อาการหลอน (Hallucinations) เนื่องจากเครื่องมือปัญญาประดิษฐ์สร้างข้อความทำงานโดยการคาดการณ์ จึงเป็นไปได้ว่าบางครั้งการคาดการณ์เหล่านี้อาจไม่ถูกต้อง ซึ่งหมายความว่าเครื่องมืออย่าง Gemini อาจเกิดข้อผิดพลาดได้แม้กระทั่งการสรุปข้อมูลโดยตรงจากเว็บไซต์ แหล่งที่มาที่ Gemini ให้ไว้อาจไม่น่าเชื่อถือ ดังนั้นควรตรวจสอบแหล่งที่มาเหล่านั้นอีกครั้งด้วย
Gemini ยังอาจให้ข้อมูลที่ไม่ถูกต้องเกี่ยวกับความสามารถของตัวเองอีกด้วย ตัวอย่างเช่น Gemini อาจบอกว่าไม่สามารถสร้างรูปภาพหรือค้นหาข้อมูลในเว็บได้ แต่ถ้าคุณเปลี่ยนคำสั่ง Gemini ก็จะสามารถทำสิ่งที่มันบอกว่าทำไม่ได้
ความลำเอียง
คำตอบของ Gemini อาจมีความลำเอียง ในบางกรณี ความลำเอียงเกิดจากข้อมูลที่ไม่เพียงพอ เช่น ข้อจำกัดเกี่ยวกับคำตอบที่เกี่ยวข้องกับวัฒนธรรมหรือประเทศใดประเทศหนึ่ง Gemini ไม่ใช่เครื่องมือเดียวที่ประสบปัญหานี้ เนื่องจากช่องว่างในข้อมูลที่ใช้เทรน
ในกรณีอื่นๆ ความลำเอียงเกิดจากอคติเชิงลบ แนวคิดที่เลือกปฏิบัติ และความคิดเห็นทางการเมืองจากชุดข้อมูลที่ใช้ ตัวอย่างเช่น คำตอบของ Gemini อาจรวมถึงภาษาที่สื่อถึงการเลือกข้างในความขัดแย้งระหว่างประเทศ แม้ว่า Gemini จะไม่ควรแสดงจุดยืนในคำตอบ แต่ความลำเอียงเหล่านี้ก็ยังมีให้เห็นระหว่างใช้งาน
ความคิดสร้างสรรค์ที่จำกัด
แม้ว่า Gemini สามารถสร้างสรรค์คอนเทนต์ได้ แต่เนื่องจาก Google เป็นที่รู้จักในฐานะผู้ให้ข้อมูล จึงไม่น่าแปลกใจที่ Chatbot ของ Google จะเน้นการตอบสนองที่ตรงไปตรงมาและให้ข้อมูลมากกว่าการสร้างสรรค์ สำหรับงานที่ต้องการความคิดสร้างสรรค์ เราอาจต้องเขียนคำสั่งที่กำหนดอย่างชัดเจน และปรับแต่งคำตอบของ Gemini ด้วยการถามต่อซึ่ง Chatbot อื่นๆ อาจจะสามารถทำได้ดีกว่า
สรุป
Gemini นับเป็น Chatbot AI ที่สามารถนำมาใช้ประโยชน์ได้อย่างหลากหลายรูปแบบ ซึ่งแน่นอนว่าสิ่งนี้จะช่วยให้การทำงานของเราสะดวกสบาย และรวดเร็วมากยิ่งขึ้นกว่าการนั่งหาข้อมูลเองใน Google แน่นอน ซึ่งในอนาคตเราอาจะได้เห็นการพัฒนาของ Gemini อีกหลายอย่าง
ตาคุณแล้ว
แม้ว่า Gemini จะช่วยปลดล็อกความสามารถใหม่ๆ ที่ช่วยให้เราได้รับข้อมูลและทำงานได้อย่างมีประสิทธิภาพมากขึ้น แต่ก็สามารถให้คำตอบที่ไม่ถูกต้องและมีความลำเอียงได้เช่นกัน ดังนั้นเมื่อเรามีความจำเป็นต้องใช้ Gemini ในการทำงาน อย่าลืมตรวจสอบคำตอบอีกครั้งเพื่อให้ได้ข้อมูลที่ไม่ผิดพลาดและมีประสิทธิภาพมากที่สุด