LALAL.AI มีอัลกอริธึม Cassiopeia ใหม่ที่จะทำให้คุณทึ่ง

LALAL.AI มีอัลกอริธึม Cassiopeia ใหม่ที่จะทำให้คุณทึ่ง

การแยกส่วนต่าง ๆ ของเพลงโดยไม่มีต้นกำเนิดจริงนั้นยาก แต่มีเครื่องมือที่เรียกว่า LALAL.AI ที่ค่อนข้างสามารถจัดการกระบวนการได้ มันแยกเพลงระหว่างเสียงร้องและเครื่องดนตรีด้วยความพยายามเพียงเล็กน้อยและไม่จำเป็นต้องมีทักษะด้านวิศวกรรมเสียง





และในขณะที่ LALAL.AI นั้นค่อนข้างแข็งแกร่งอยู่แล้ว แต่เมื่อเร็ว ๆ นี้ก็ได้ก้าวไปข้างหน้าอย่างมากด้วยการเปิดตัวสถาปัตยกรรมเครือข่ายประสาทใหม่ที่เรียกว่า Cassiopeia ต้องใช้ Rocknet ซึ่งเป็นโครงข่ายประสาทเทียมรุ่นก่อนของบริการ และทำให้ดีขึ้นในทุกๆ ด้าน





วิธีรีเซ็ต windows 10 จากโรงงานโดยไม่ต้องตั้งค่า

Cassiopeia ของ LALAL.AI นำอะไรมาสู่โต๊ะ?

พูดง่ายๆ ก็คือ Cassiopeia ให้ผลลัพธ์การแยกที่ดีขึ้นด้วยสิ่งประดิษฐ์เสียงที่น้อยลงอย่างมาก จุดประสงค์ทั้งหมดของ LALAL.AI คือการดึงและแยกเสียงร้องและเครื่องดนตรีออกจากแทร็ก การมีคุณสมบัติที่สามารถปรับปรุงความสามารถได้นั้นยอดเยี่ยมมาก





ด้วยโครงข่ายประสาทเทียมใหม่ LALAL.AI จะใช้เวลานานกว่าเล็กน้อยในการสร้างรอยแยก แต่นั่นเป็นการประนีประนอมเล็กน้อยสำหรับการปรับปรุงคุณภาพอย่างมากมาย

แล้วอะไรล่ะที่ต่างกัน? โดยพื้นฐานแล้ว Rocknet ซึ่งยังคงใช้งานได้บน LALAL.AI จะพิจารณาเฉพาะองค์ประกอบแอมพลิจูดโดยไม่สนใจองค์ประกอบเฟส โครงข่ายประสาท Cassiopeia ที่ใหม่กว่าจะพิจารณาองค์ประกอบเฟสของสัญญาณอินพุตและสร้างเฟสสำหรับสัญญาณเอาต์พุต ในกระบวนการนี้ แทร็กแยกจะมีสิ่งประดิษฐ์เสียงน้อยลง



พูดง่ายๆ ก็คือ อัลกอริธึมใหม่ต้องวิเคราะห์เพลงอย่างละเอียดเพื่อสร้างการแยกเพลงที่ดีขึ้น

เพื่อพิสูจน์ว่าบริการทำงานได้อย่างมีประสิทธิภาพมากขึ้น LALAL.AI ได้ทดสอบกับ Spleeter, OpenUnmix และ Extended Unmix นอกจากนี้ยังเปรียบเทียบผลลัพธ์กับเครือข่ายประสาท Rocknet ของตัวเอง สามารถดูผลการทดสอบทั้งหมดได้ที่ บล็อกของ LALAL.AI แต่โดยพื้นฐานแล้ว Cassiopeia ทำได้ดีกว่าประเภทอื่นๆ ทั้งหมดในหมวดหมู่ส่วนใหญ่ในแนวเพลงที่สุ่มเลือก เช่น แจ๊ส ซอฟต์ร็อก ป๊อป และอื่นๆ





ที่น่าสนใจคือ Rocknet ยังทำได้ดีกว่าในช่องเสียงร้อง Cassiopeia มีการแทรกซึมจากเครื่องดนตรีเข้าไปในเสียงร้องเล็กน้อย อย่างไรก็ตาม LALAL.AI ชี้ให้เห็นว่าตัวเลขไม่ได้บอกเรื่องราวทั้งหมดเสมอไป และบางครั้งคุณภาพเสียงอาจแตกต่างจากที่ทดสอบแสดง

นี่คือสิ่งที่บริษัทกล่าวในเรื่องนี้:





แม้ว่า Cassiopeia จะล้าหลัง Rocknet ในแง่ของการวัดที่เป็นทางการสำหรับเสียงร้อง ทั้งส่วนของเครื่องดนตรีและโดยเฉพาะอย่างยิ่งก้านเสียงที่แยกจากกันโดย Cassiopeia ให้เสียงที่เป็นธรรมชาติและนุ่มนวลกว่าของ Rocknet มาก โดยไม่มีสิ่งประดิษฐ์ที่ทำให้เกิดเสียงที่เป็นโลหะซึ่งเป็นลักษณะเฉพาะของโซลูชันอื่นๆ

windows 10 อุปกรณ์ usb ที่ไม่รู้จัก (คำขอตัวอธิบายอุปกรณ์ล้มเหลว)

ฉันทดสอบผลลัพธ์ด้วยตัวเอง และพบว่าโครงข่ายประสาทของ Cassiopeia ส่งผลให้มีการแยกเสียงที่สะอาดขึ้น แทร็กเสียงแทบไม่มีการแทรกซึมจากเครื่องดนตรีซึ่งเป็นสิ่งที่คุณต้องการจากเครื่องมืออย่าง LALAL.AI

จากที่กล่าวมา ผลลัพธ์จาก Rocknet ยังค่อนข้างดี และพวกมันก็ใช้งานได้ดีสำหรับการแยกแทร็กเสียงออกจากเครื่องดนตรี

วิธีที่ดีที่สุดในการสแกนภาพถ่ายเก่า

คุณลองใช้ฟีเจอร์ Cassiopeia ใหม่ของ LALAL.AI ได้อย่างไร?

หากคุณต้องการทดลองโครงข่ายประสาทเทียมใหม่ คุณสามารถไปที่ LALAL.AI และให้แน่ใจว่า ใช้อัลกอริทึมใหม่ ถูกเลือกไว้ใกล้กับด้านล่างของหน้าจอเมื่อคุณอัปโหลดเพลง

คุณยังสามารถเลือกระดับความก้าวร้าวที่อัลกอริทึมใช้เพื่อแยกแทร็กได้ Normal นั้นดีสำหรับแทร็กส่วนใหญ่ แต่คุณสามารถทดลองกับ Mild และ Aggressive เพื่อดูว่าอะไรสร้างแทร็กที่ดีกว่าสำหรับคุณ

แบ่งปัน แบ่งปัน ทวีต อีเมล LALAL.AI ทำให้การแยกเสียงร้องและเครื่องดนตรีเป็นเรื่องง่าย

แทนที่จะใช้เวลาหลายชั่วโมงในการสร้างลำต้น LALAL.AI ผู้ใช้ปัญญาประดิษฐ์จะทำมันในไม่กี่วินาที

อ่านต่อไป
หัวข้อที่เกี่ยวข้อง
  • เลื่อนขั้น
  • การผลิตดนตรี
เกี่ยวกับผู้เขียน Dave LeClair(ตีพิมพ์บทความ 1470)

Dave LeClair เป็นผู้ประสานงานวิดีโอของ MUO และเป็นนักเขียนให้กับทีมข่าว

เพิ่มเติมจาก Dave LeClair

สมัครรับจดหมายข่าวของเรา

เข้าร่วมจดหมายข่าวของเราสำหรับเคล็ดลับทางเทคนิค บทวิจารณ์ eBook ฟรี และดีลพิเศษ!

คลิกที่นี่เพื่อสมัครสมาชิก