ChatGPT ขับเคลื่อนโลกเทคโนโลยีโดยพายุ และไม่มีการขาดแคลนความก้าวหน้าและการอัพเดท แต่ถึงแม้จะใช้เทคโนโลยีขั้นสูง แต่ก็มีปัจจัยจำกัดบางประการในเวอร์ชันปัจจุบัน
ปัจจัยหนึ่งคือระบบโทเค็นซึ่งยังคงทำลายวงจรวิวัฒนาการ ทำให้ยูทิลิตี้ของแอปลดลง หากคุณใช้ ChatGPT คุณอาจต้องการทราบเกี่ยวกับโทเค็นของ ChatGPT และสิ่งที่ต้องทำเมื่อโทเค็นหมด
สร้างวิดีโอประจำวัน เลื่อนเพื่อดำเนินการต่อกับเนื้อหา
ลองย้อนกลับไปและให้ข้อมูลเชิงลึกเกี่ยวกับทุกสิ่งที่ควรทราบเกี่ยวกับกลไกการทำงานพื้นฐานของแอป
โทเค็น ChatGPT คืออะไร
หากคุณเดินผ่านด้านหน้าของแอป สิ่งที่คุณเห็นคือภาษาคอมพิวเตอร์ที่ปฏิบัติตามคำสั่งของคุณและให้คำตอบที่คุณต้องการ อย่างไรก็ตาม แบ็กเอนด์เป็นเพียงโค้ดจำนวนมาก เรียนรู้ทุกนาที และตามทันคำถามที่ตอบ
ChatGPT แปลงแต่ละคำเป็นโทเค็นที่อ่านได้ทุกครั้งที่คุณถามคำถาม หากต้องการแยกย่อยเพิ่มเติม โทเค็นคือส่วนย่อยของข้อความ และแต่ละภาษาโปรแกรมจะใช้ชุดค่าโทเค็นที่แตกต่างกันเพื่อทำความเข้าใจข้อกำหนด
เนื่องจากคอมพิวเตอร์ไม่เข้าใจค่าข้อความโดยตรง จึงแบ่งค่าเหล่านี้ออกเป็นตัวเลขผสมกัน ซึ่งมักเรียกว่าการฝัง คุณยังสามารถพิจารณาการฝังเช่น รายการหลาม ซึ่งคล้ายกับรายการของตัวเลขที่เกี่ยวข้องกัน เช่น [1.1,2.1,3.1,4.1…n]
เมื่อ ChatGPT รับอินพุตเริ่มต้น ระบบจะพยายามคาดการณ์อินพุตถัดไปที่เป็นไปได้ตามข้อมูลก่อนหน้า มันเลือกรายการทั้งหมดของโทเค็นก่อนหน้า และใช้การสังเคราะห์รหัสของมัน พยายามที่จะครอบครองการป้อนข้อมูลที่ตามมาโดยผู้ใช้ มันใช้และคาดการณ์ทีละโทเค็นเพื่อให้ภาษาเข้าใจการใช้งานได้ง่ายขึ้น
เพื่อปรับปรุงการคาดคะเนและปรับปรุงความแม่นยำ ระบบจะรวบรวมรายชื่อการฝังทั้งหมดและส่งผ่านเลเยอร์ของทรานสฟอร์มเมอร์เพื่อสร้างความสัมพันธ์ระหว่างคำต่างๆ ตัวอย่างเช่น เมื่อคุณถามคำถามเช่น 'ใครคือโทมัส เอดิสัน' ChatGPT จะเลือกคำที่มีค่าที่สุดในรายการ: WHO และ เอดิสัน .
เลเยอร์ของ Transformer มีบทบาทในกระบวนการทั้งหมด เลเยอร์เหล่านี้เป็นรูปแบบหนึ่งของสถาปัตยกรรมเครือข่ายประสาทที่ได้รับการฝึกฝนให้รับคำหลักที่เกี่ยวข้องมากที่สุดจากชุดคำ อย่างไรก็ตาม กระบวนการฝึกอบรมไม่ง่ายอย่างที่คิด เนื่องจากต้องใช้เวลานานในการฝึกเลเยอร์หม้อแปลงบนข้อมูลขนาดกิกะไบต์
แม้ว่า ChatGPT จะคาดการณ์เพียงครั้งละหนึ่งโทเค็น แต่เทคโนโลยี auto-regressive นั้นได้รับการตั้งโปรแกรมให้ทำนายและป้อนกลับเข้าไปในโมเดลหลักเพื่อปล่อยเอาต์พุต โมเดลได้รับการปรับให้ทำงานเพียงครั้งเดียวสำหรับทุกๆ โทเค็น ดังนั้นผลลัพธ์จะถูกพิมพ์ทีละคำ เอาต์พุตจะหยุดโดยอัตโนมัติเมื่อแอปพลิเคชันพบคำสั่งหยุดโทเค็น
ตัวอย่างเช่น หากคุณดูเครื่องคำนวณโทเค็นบนเว็บไซต์ ChatGPT คุณสามารถคำนวณพื้นฐานการใช้โทเค็นตามคำถามของคุณได้
superfetch windows 10 การใช้งานดิสก์สูง
ลองป้อนข้อความตัวอย่าง เช่น:
How do I explain the use of tokens in ChatGPT?
ตามเครื่องคิดเลข มี 46 ตัวอักษรในสตริงนี้ ซึ่งจะใช้ 13 โทเค็น หากคุณแยกย่อยออกเป็น Token ID จะมีลักษณะดังนี้:
[2437, 466, 314, 4727, 262, 779, 286, 16326, 287, 24101, 38, 11571, 30]
ตามที่ เครื่องคำนวณโทเค็น OpenAI :