MusicLM ของ Google เป็นไปตามโฆษณาหรือไม่

MusicLM ของ Google เป็นไปตามโฆษณาหรือไม่
ผู้อ่านเช่นคุณช่วยสนับสนุน MUO เมื่อคุณทำการซื้อโดยใช้ลิงก์บนเว็บไซต์ของเรา เราอาจได้รับค่าคอมมิชชั่นจากพันธมิตร อ่านเพิ่มเติม.

ในเดือนมกราคม 2023 Google ได้ประกาศ MusicLM ซึ่งเป็นเครื่องมือ AI รุ่นทดลองที่สามารถสร้างเพลงตามคำอธิบายข้อความ นอกจากข่าวแล้ว Google ยังปล่อยงานวิจัยที่น่าทึ่งสำหรับ MusicLM ซึ่งทำให้หลายคนตื่นตาตื่นใจกับความสามารถในการเสกเสียงเพลงจากอากาศที่เบาบาง





สร้างวิดีโอประจำวัน เลื่อนเพื่อดำเนินการต่อกับเนื้อหา

เมื่อได้รับข้อความ นางแบบสัญญาว่าจะผลิตเพลงที่มีความเที่ยงตรงสูงซึ่งให้คำอธิบายทุกประเภทตั้งแต่แนวเพลงไปจนถึงเครื่องดนตรี ไปจนถึงคำบรรยายเชิงนามธรรมที่อธิบายงานศิลปะที่มีชื่อเสียง ตอนนี้ MusicLM เปิดให้สาธารณชนเข้าชมแล้ว เราจึงตัดสินใจทดสอบ





ความพยายามของ Google ในการสร้าง AI Music Generator

  เว็บแอปพลิเคชันสำหรับ Google's MusicLM AI music generator

การเปลี่ยนข้อความอย่างเช่น 'เพลงแจ๊สที่ผ่อนคลาย' ให้เป็นเพลงที่พร้อมเล่นถือเป็นการทดลองที่ศักดิ์สิทธิ์ในเพลง AI เช่นเดียวกับโปรแกรมสร้างภาพ AI ชื่อดังอย่าง Dall-E หรือ Midjourney คุณไม่จำเป็นต้องมีความรู้ด้านดนตรีสักเล็กน้อยเพื่อสร้างแทร็กที่มีทำนองและจังหวะ





ในเดือนพฤษภาคม 2023 ผู้ที่ลงชื่อสมัครใช้ AI Test Kitchen ของ Google จะได้ทดลองใช้การสาธิตเป็นครั้งแรก ได้รับการต้อนรับจากหน้าเว็บที่เป็นมิตรต่อผู้ใช้และกฎแนวทางสองสามข้อ—เครื่องดนตรีอิเล็กทรอนิกส์และคลาสสิกทำงานได้ดีที่สุด และอย่าลืมระบุ “กลิ่นอาย”—การผลิตตัวอย่างเพลงเป็นเรื่องง่ายอย่างเหลือเชื่อ

ความเร็วเป็นหนึ่งในไม่กี่อย่างที่ MusicLM นำเสนออย่างแท้จริง ควบคู่ไปกับตัวอย่างที่มีความเที่ยงตรงค่อนข้างสูง อย่างไรก็ตาม การทดสอบจริงไม่ควรวัดด้วยนาฬิกาจับเวลาเพียงอย่างเดียว MusicLM สามารถสร้างเพลงที่ฟังได้จริงโดยใช้คำไม่กี่คำได้หรือไม่ ไม่แน่นอน (เราจะพูดถึงเรื่องนี้ในไม่ช้า)



วิธีใช้ MusicLM ในครัวทดสอบ AI ของ Google

การใช้ MusicLM เป็นเรื่องง่าย คุณสามารถลงชื่อสมัครใช้รายการรอได้ ครัวทดสอบ AI ของ Google ถ้าคุณต้องการให้มันไป

ในเว็บแอป คุณจะเห็นกล่องข้อความที่คุณสามารถเขียนข้อความสั้นๆ จากคำไม่กี่คำไปจนถึงสองสามประโยคเพื่ออธิบายถึงประเภทของเพลงที่คุณต้องการฟัง เพื่อให้ได้ผลลัพธ์ที่ดีที่สุด Google แนะนำให้คุณ 'อธิบายให้ชัดเจน' โดยเสริมว่าคุณควรพยายามใส่อารมณ์และความรู้สึกของเพลงเข้าไปด้วย





เมื่อคุณพร้อม ให้กด Enter เพื่อเริ่มดำเนินการ ภายในเวลาประมาณ 30 วินาที ตัวอย่างเสียง 2 รายการจะพร้อมให้คุณออดิชั่น จากทั้งสองตัวเลือก คุณมีตัวเลือกในการให้รางวัลแก่ตัวอย่างที่ดีที่สุดที่ตรงกับข้อความแจ้งของคุณ ซึ่งจะช่วยให้ Google ฝึกฝนโมเดลและปรับปรุงผลลัพธ์ของโมเดล

MusicLM ฟังดูเป็นอย่างไร

มนุษย์สร้างดนตรีมาตั้งแต่อย่างน้อย 40,000 ปีก่อน โดยไม่ทราบแน่ชัดว่าดนตรีเกิดขึ้นก่อน หลัง หรือพร้อมๆ กับพัฒนาการของภาษา ดังนั้นจึงไม่น่าแปลกใจเลยที่ MusicLM ยังไม่ได้ไขรหัสของศิลปะสากลโบราณนี้เสียทีเดียว





เอกสารการวิจัย MusicLM ของ Google แนะนำว่า MusicLM สามารถสร้างเพลงจากคำบรรยายที่เป็นของงานศิลปะที่มีชื่อเสียง และทำตามคำแนะนำ เช่น การเปลี่ยนประเภทหรืออารมณ์ในแบบที่ราบรื่นตามลำดับของข้อความแจ้งต่างๆ

อย่างไรก็ตาม ก่อนที่จะได้รับคำสั่งซื้อที่สูงเช่นนี้ เราพบว่า MusicLM มีปัญหาพื้นฐานหลายอย่างที่ต้องเอาชนะให้ได้ก่อน

ค้นหาบัญชีที่เชื่อมโยงกับอีเมลได้ฟรี

ความยากลำบากในการยึดติดกับ Tempo

งานพื้นฐานที่สุดของนักดนตรีคือการเล่นให้ทันเวลา กล่าวอีกนัยหนึ่งให้ยึดติดกับจังหวะ น่าแปลกที่ MusicLM ทำไม่ได้ 100% ตลอดเวลา

ในความเป็นจริง การใช้พรอมต์เดียวกัน 10 ครั้งซึ่งสร้างแทร็กเพลง 20 แทร็ก มีเพียงสามเพลงเท่านั้นที่ทันเวลา ตัวอย่างที่เหลืออีก 17 ตัวอย่างนั้นเร็วหรือช้ากว่าจังหวะที่ระบุซึ่งเขียนเป็น 'จังหวะต่อนาที' ซึ่งเป็นคำที่ใช้กันอย่างแพร่หลายเพื่ออธิบายดนตรี

ในตัวอย่างนี้ เราใช้ข้อความแจ้ง 'เปียโนคลาสสิกเดี่ยวที่เล่น 80 ครั้งต่อนาที เงียบสงบและรำพึงรำพัน' เมื่อฟังอย่างใกล้ชิด เพลงมักจะเร็วขึ้นหรือช้าลงภายในความยาวตัวอย่างเล็กน้อย

เพลงยังขาดจังหวะที่หนักแน่นและฟังราวกับว่ามีคนตีเล่นกลางท่อน ไม่ว่าจะโดยตั้งใจหรือไม่ก็ตาม มันเป็นเรื่องยากที่จะตัดสินว่า MusicLM สามารถแต่งเพลงเริ่มต้นหรือจบเพลงได้อย่างเหมาะสมนอกเหนือจากการเกาะติดจังหวะ

การเลือกเครื่องมือแบบสุ่ม

บางที MusicLM ยังไม่ได้เรียนรู้วิธีการเล่นในจังหวะที่เข้มงวด ดังนั้นเราจึงเปลี่ยนไปใช้พารามิเตอร์ดนตรีทั่วไปอื่น เราต้องการดูว่ามันจะอนุญาตคำขอของเราสำหรับตราสารบางอย่างหรือไม่

วิธีปิดการควบคุมโดยผู้ปกครองใน kodi

เราเขียนข้อความแจ้งต่างๆ มากมายที่มีคำอธิบาย เช่น 'Solo synthesizer' และ 'Solo bass guitar' วงอื่นเป็นวงดนตรีขนาดใหญ่เช่น 'วงเครื่องสาย' หรือ 'วงดนตรีแจ๊ส' โดยรวมแล้วดูเหมือนว่ามีโอกาส 50:50 ที่คุณจะได้ในสิ่งที่ขอ

ทฤษฎีหนึ่งคือแบบจำลองนั้นเชื่อมโยงเครื่องดนตรีบางอย่างกับแนวดนตรียอดนิยม ยกตัวอย่างเช่น ประโยคที่ว่า 'Solo synthesizer, Chord progression. Lively and upbeat' แทนที่จะได้เสียงซินธิไซเซอร์มาเอง MusicLM ได้ผลิตเพลงอิเล็กทรอนิกส์ที่มีทั้งกลองและเบส

เป็นไปได้ว่าโมเดลมีข้อมูลไม่เพียงพอและการฝึกอบรมเพียงพอที่จะเข้าใจคำขอเฉพาะสำหรับเครื่องมือ

เสียงร้องอยู่นอกสมการ

ตามข้อจำกัดในขณะนั้น โมเดลจะไม่สร้างเพลงที่มีเสียงร้อง ปัญหาลิขสิทธิ์ที่ยุ่งยากของ MusicLM และเสียงร้องที่มีปัญหา เป็นปัจจัยที่ทำให้ Google เลือกที่จะเล่นอย่างปลอดภัยโดยการตั้งค่าข้อจำกัดนี้

แต่หลังจากทดลองใช้ MusicLM ระยะหนึ่ง เราก็พบว่าการควบคุมของ Google ต่อเอาต์พุตของโมเดลนั้นไม่ได้เป็นการบังคับ น่าแปลกที่เสียงเตือนอย่าง 'กีตาร์อะคูสติก' จะสร้างแทร็กที่มีเสียงร้องเหมือนผีในแบ็คกราวด์ซึ่งฟังดูอู้อี้และห่างไกล

แม้ว่าสิ่งนี้จะไม่ใช่เหตุการณ์ทั่วไป แต่ก็ทำให้คุณสงสัยเกี่ยวกับความสามารถของ MusicLM ในการสร้างเสียงร้องที่น่าเชื่อถือตั้งแต่แรก

ด้วยซอฟต์แวร์อย่าง VOCALOID และ Synthesizer V ที่เป็นผู้นำ เทคโนโลยีการสังเคราะห์เสียงด้วย AI การละเว้นเสียงร้องจากรุ่นปัจจุบันทำให้เราสงสัยว่ามันยังไม่ดีพอที่จะแข่งขันกับเทคโนโลยีที่มีอยู่หรือไม่ MusicLM อาจมีหนทางอีกยาวไกลก่อนที่นักดนตรีจะร้องเพลงสรรเสริญ

อนาคตของเครื่องกำเนิดเพลง AI

  คำแนะนำที่แตกต่างกันใน MusicLM's web application

แม้ว่า MusicLM ได้ขับเคลื่อนเทคโนโลยีเพลง AI กำเนิดไปข้างหน้า แต่จำเป็นต้องกลับไปโรงเรียนและเรียนรู้อีกสองสามอย่างก่อนที่จะสามารถทำงานจริงในอุตสาหกรรมดนตรีได้

ก่อนหน้านี้ ความพยายามที่ดีที่สุดในการสร้างเพลงด้วย AI คือโมเดลที่เรียกว่า JukeboxAI โดย OpenAI มันไม่ได้อยู่ในสภาพพร้อมใช้งานอย่างแน่นอน และต้องใช้เวลาถึงเก้าชั่วโมงในการเรนเดอร์เพลงเพียงหนึ่งนาที

จากความพยายามของคุณ คุณมีแนวโน้มที่จะได้แทร็กเสียงที่เหมือนมนุษย์ต่างดาวอย่างแท้จริงซึ่งเต็มไปด้วยความผิดเพี้ยนของเสียงและสิ่งประดิษฐ์ ในทางกลับกัน คุณจะไม่เบื่อเลย ฟังการสร้างสรรค์ที่แปลกประหลาดที่ Jukebox เสก .

ด้วยเหตุนี้ MusicLM จึงมีความก้าวหน้าที่สำคัญบางประการต่อเครื่องกำเนิดเพลง AI ที่เป็นมิตรกับผู้ใช้ เราเกือบจะยกโทษให้โมเดลสำหรับเอาต์พุตแบบสุ่มเมื่อคุณหยุดคิดว่าการสร้างเพลงในรูปแบบเสียงดิบนั้นซับซ้อนเพียงใด

อย่างไรก็ตาม หลังจากทำให้โมเดลใช้งานได้แล้ว MusicLM ก็รู้สึกทึ่งเมื่อเปรียบเทียบกับสิ่งที่ Google เผยแพร่ในเอกสารการวิจัยเบื้องต้น น้อยครั้งนักที่ตัวสร้างภาพ AI จะเข้าใจภาพลักษณ์ของ Apple ผิด เช่นเดียวกัน ตัวกำเนิดเสียงดนตรี AI ควรได้รับพื้นฐานบางอย่างที่ถูกต้อง เช่น จังหวะและเครื่องดนตรี

MusicLM ของ Google ขาดความคาดหมาย

เมื่อบริษัทเทคโนโลยีต่างแข่งขันกันเพื่อแข่งขันกันในด้าน AI MusicLM จึงรู้สึกราวกับว่าได้เข้าสู่การทดลองใช้งานสาธารณะก่อนที่จะพร้อม แทนที่จะทำให้ได้พื้นฐานที่ถูกต้อง โมเดลดูเหมือนจะใช้แนวทางที่คลุมเครือและเป็นอัตวิสัยมากกว่าในการผลิตเพลง

Google อาจสนับสนุนให้คุณเจาะจงกับข้อความแจ้งของคุณ แต่ไม่สามารถจัดการกับจังหวะได้ดี และเราไม่รับประกันว่าคุณจะได้รับเครื่องดนตรีที่คุณขอทุกครั้ง MusicLM อาจน่าสนใจและเป็นการสาธิตที่ดีเกี่ยวกับความก้าวหน้าของ AI ที่ทรงพลัง แต่ถ้าดนตรีเป็นเป้าหมายสุดท้าย หนทางยังอีกยาวไกล