ในวิดีโอนี้ ฉันจะแสดงตัวอย่างการเรียนรู้ช็อตสองสามตัวอย่างโดยใช้ GPT-Neo: โซลูชันโอเพนซอร์สสำหรับ GPT-3 GPT‑Neo เป็นชื่อรหัสสำหรับตระกูลรุ่นภาษาที่ใช้หม้อแปลงไฟฟ้า ซึ่งมีรูปแบบหลวมๆ รอบสถาปัตยกรรม GPT เป้าหมายที่ระบุไว้ของโครงการคือการจำลองแบบจำลองขนาด GPT‑3 DaVinci และโอเพนซอร์สต่อสาธารณะโดยไม่เสียค่าใช้จ่าย
GPT‑Neo คือการนำโมเดลและแบบจำลองที่คล้าย GPT‑2 และ GPT‑3 แบบขนานข้อมูลมาใช้ โดยใช้ Mesh Tensorflow สำหรับการสนับสนุนแบบกระจาย ฐานรหัสได้รับการปรับให้เหมาะสมสำหรับ TPU แต่ยังใช้งานได้กับ GPU ที่น่าสนใจคือก่อนหน้านี้ Leahy พยายามจำลอง GPT-2 ผ่านโปรแกรม Tensorflow Research Cloud (TFRC) ของ Google ซึ่งใช้ได้ผลดีในขณะที่ทำงานกับ GPT-Neo
เข้าร่วมช่องนี้เพื่อเข้าถึงสิทธิพิเศษ:
https://www.youtube.com/channel/UC8ofcOdHNINiPrBA9D59Vaw/join
ลิงค์ไปยังสมุดบันทึก : https://github.com/bhattbhavesh91/few-shot-learning-using-gpt-neo/blob/main/few-shot-learning-gpt-neo-notebook.ipynb
ถ้าคุณชอบผลงานของฉัน คุณสามารถสนับสนุนฉันโดยการซื้อกาแฟให้ฉันโดยคลิกที่ลิงค์ด้านล่าง: https://www.buymeacoffee.com/bhattbhavesh91
หากคุณมีคำถามใด ๆ เกี่ยวกับสิ่งที่เรากล่าวถึงในวิดีโอนี้ โปรดอย่าลังเลที่จะถามในส่วนความคิดเห็นด้านล่าง และฉันจะพยายามตอบคำถามเหล่านั้นให้ดีที่สุด
หากคุณชอบบทช่วยสอนเหล่านี้และต้องการสนับสนุน วิธีที่ง่ายที่สุดคือการกดชอบวิดีโอและยกนิ้วให้ และยังเป็นความช่วยเหลืออย่างมากในการแชร์วิดีโอเหล่านี้กับทุกคนที่คุณคิดว่าจะเห็นว่ามีประโยชน์
โปรดพิจารณาคลิกปุ่ม SUBSCRIBE เพื่อรับการแจ้งเตือนสำหรับวิดีโอในอนาคต & ขอขอบคุณทุกท่านที่รับชม
คุณสามารถหาฉันได้ที่:
บล็อก - https://bhattbhavesh91.github.io
ทวิตเตอร์ - https://twitter.com/_bhaveshbhatt
GitHub - https://github.com/bhattbhavesh91
ปานกลาง - https://medium.com/@bhattbhavesh91
เกี่ยวกับฉัน - https://about.me/bhattbhavesh91
ลิงค์ทรี - https://linktr.ee/bhattbhavesh91
ชุมชน DEV - https://dev.to/bhattbhavesh91
#GPT3 #กอดใบหน้า
#ผู้พัฒนา
www.youtube.com
EleutherAI GPT-Neo เวอร์ชันโอเพ่นซอร์สของ GPT-3
ในวิดีโอนี้ ฉันจะแสดงตัวอย่างการเรียนรู้ช็อตสองสามตัวอย่างโดยใช้ GPT-Neo: โซลูชันโอเพนซอร์สสำหรับ GPT-3 GPT‑Neo เป็นชื่อรหัสสำหรับตระกูลรุ่นภาษาที่ใช้หม้อแปลงไฟฟ้า ซึ่งมีรูปแบบหลวมๆ รอบสถาปัตยกรรม GPT เป้าหมายที่ระบุไว้ของโครงการคือการจำลองแบบจำลองขนาด GPT‑3 DaVinci และโอเพนซอร์สต่อสาธารณะโดยไม่เสียค่าใช้จ่าย