36 C
Bangkok
Tuesday, March 19, 2024
HomeResearch & Science

Research & Science

Alibaba เปิดตัว AI ใหม่ “EMO” สร้างวีดีโอคนพูดหรือร้องเพลงจากภาพได้สุดสมจริง 

นักวิจัยจาก Institute for Intelligent Computing ของ Alibaba ล่าสุดได้พัฒนาระบบ AI ใหม่ที่มีชื่อว่า “EMO” ที่สามารถสร้างสรรค์วีดีโอบุคคลให้พูดหรือร้องเพลงได้จากภาพถ่าย Portrait เพียงภาพเดียว ได้แบบเนียนมาก ๆ  EMO ย่อมาจาก Emote Portrait Alive หรือบอกถึงลักษณะของโมเดลที่ทำชัดเจนว่าเป็นการทำให้ภาพแสดงอารมณ์ออกมาเหมือนมีชีวิต ซึ่งในงานตีพิมพ์ ได้อธิบายว่าระบบนี้สามารถสร้างการเคลื่อนไหวทางสีหน้าพร้อมกับขยับเคลื่อนไหวไปมาได้อย่างลื่นไหลตามเสียงที่ใส่เข้าไปได้อย่างจังหวะใกล้เคียงสุด ๆ  โดยเบื้องหลังของงานวิจัยนี้คือโมเดล...

OpenAI เปิดตัว “Sora” โมเดล AI สร้างวีดีโอจากข้อความได้ถึง 60 วินาที

หลังจากนี้ OpenAI อาจจะไม่ได้เป็นที่รู้จักแค่เพราะ ChatGPT หรือเป็นบริษัท LLM อีกต่อไปแล้ว เพราะล่าสุด OpenAI ได้เปิดตัว “Sora” โมเดล AI ที่ทำเรื่อง Text-To-Video สร้างวีดีโอได้จากข้อความ Prompt ซึ่งวีดีโอที่ได้นั้นเรียกว่าสวยงามจนแทบแยกไม่ออก และยังสามารถยาวได้ถึง 60 วินาทีอีกด้วย โดย CEO และ Co-Founder...

นักวิจัย MIT พัฒนาสติกเกอร์อัลตร้าซาวนด์ รู้ทันไตวายเฉียบพลันล่วงหน้า

วิศวกร MIT พัฒนานวัตกรรมใหม่ ซึ่งเป็นสติกเกอร์อัลตร้าซาวนด์ขนาดเท่าแสตมป์ ออกแบบมาสำหรับตรวจอวัยวะภายในของผู้ป่วย ส่งสัญญาณเตือนหากเกิดภาวะตับหรือไตวาย เซ็นเซอร์รูปแบบแผ่นแปะสติกเกอร์ดังกล่าวจะส่งคลื่นเสียงผ่านผิวหนังเข้าไปยังร่างกาย และคลื่นก็จะสะท้อนจากอวัยวะภายในกลับมาที่สติกเกอร์ โดยที่สติกเกอร์นี้จะวัดและติดตามรูปแบบคลื่นที่สะท้อนกลับมา เช่นเดียวกับการตรวจด้วยอัลตราซาวนด์ จากนั้นจึงแปลผลเป็นสัญญาณความแข็งแรงของอวัยวะภายใน  สติกเกอร์อัลตร้าซาวนด์สามารถติดตามผลอย่างต่อเนื่องเป็นเวลา 48 ชั่วโมง โดยไม่รบกวนผู้ป่วย อีกทั้งยังสามารถตรวจจับการเปลี่ยนแปลงแม้เพียงเล็กน้อยที่อาจเป็นสัญญาณของโรคได้ จากการทดสอบเบื้องต้นกับหนู พบว่าสติกเกอร์นี้สามารถตรวจพบสัญญาณเริ่มต้นของภาวะตับวายเฉียบพลันในหนูได้ ซึ่งตอนนี้ยังอยู่ระหว่างทดสอบกับมนุษย์ ทีมนักวิจัยยังคงต้องพัฒนาให้มีขนาดพกพาง่ายขึ้น รวมถึงย่อขนาดอุปกรณ์อิเล็กทรอนิกส์และส่วนประมวลผลให้เล็กลง เพื่อให้พอดีกับแผ่นสติกเกอร์ นวัตกรรมนี้จึงถือว่ามีประโยชน์ต่อกระบวนการรักษา โดยไม่ต้องรอให้อาการรุนแรงเกินเยียวยา และคาดว่าในอนาคต ผู้ป่วนสามารถใช้แผ่นสติกเกอร์นี้เองได้ที่บ้านเพื่อติดตามอาการในระยะยาวขึ้น ผู้ที่สนใจสามารถอ่านงานวิจัยฉบับเต็มได้ที่นี่

การ์ทเนอร์เผย Deepfakes เป็นเหตุให้ การยืนยันและพิสูจน์ตัวตนแบบเอกเทศ จะไม่น่าเชื่อถืออีกต่อไป [PR]

การ์ทเนอร์คาดการณ์ว่าในปี 2569 การโจมตีแบบ Deepfakes ที่สร้างโดยปัญญาประดิษฐ์กับเทคโนโลยีระบุตัวตนบนใบหน้าหรือ Face Biometrics เป็นเหตุให้องค์กรประมาณ 30% มองว่าโซลูชันการยืนยันและพิสูจน์ตัวตนจะไม่น่าเชื่อถืออีกต่อไปหากนำมาใช้แบบเอกเทศ มร. อากิฟ ข่าน รองประธานฝ่ายวิจัยการ์ทเนอร์ กล่าวว่า “ช่วงทศวรรษที่ผ่านมา มีจุดเปลี่ยนสำคัญด้าน AI เกิดขึ้นหลายประการ นั่นทำให้เกิดการสร้างภาพสังเคราะห์ขึ้นได้ โดยภาพใบหน้าคนจริง ๆ ที่สร้างขึ้นปลอม ๆ เหล่านี้...

นักวิจัยทดสอบ เด็ก กับ AI: ใครเรียนรู้ได้ดีกว่ากัน?

กว่า AI อย่าง ChatGPT จะสามารถเขียนภาษาอังกฤษเป็นภาษาที่พอเข้าใจได้ ต้องอาศัยชุดข้อมูลภาษานับล้านล้านคำ แต่ทำไมเด็ก ๆ ที่ได้รับข้อมูลภาษาเพียงแค่เสี้ยวเดียวนั้น พอถึงอายุ 3 ขวบ ก็สามารถใช้ภาษาที่ซับซ้อนขึ้นสื่อสารได้แล้ว? ทีมนักวิจัยจาก New York University จึงตั้งคำถามว่า AI จะเรียนรู้แบบเด็กทารกได้หรือไม่ แล้วโมเดล AI จะเป็นอย่างไรถ้าได้รับชุดข้อมูลขนาดเล็กลง เหมือนที่เด็ก ๆ...

Apple เปิดตัว “MGIE” โมเดล AI ปรับแต่งภาพได้ด้วยภาษาธรรมชาติ

อีกหนึ่งนวัตกรรมอันน่าทึ่งจาก Apple คือโมเดล AI ล่าสุดที่ Apple ปล่อยออกมา Open Source บน Hugging Face แล้วในชื่อ “MGIE” โมเดล AI ที่สามารถแก้ไขภาพได้ด้วยคำสั่งที่เป็นภาษาธรรมชาติได้เลย  โดย MGIE ย่อมาจาก MLLM - Guided Image Editing...

นักวิจัย Google เผย “Lumiere” โมเดล Space-Time Diffusion สร้างวีดีโอจากข้อความได้อย่างสมจริง

หลังจากที่องค์กรเริ่มหันมาปรับใช้ Generative AI กันมากขึ้นเรื่อย ๆ วิวัฒนาการของเทคโนโลยี AI จึงมีออกมาให้เห็นอย่างต่อเนื่อง ล่าสุดทีมนักวิจัยและ Google ได้เปิดเผยงานตีพิมพ์ที่แสดงให้เห็นว่าโมเดล Lumiere สามารถสร้างวีดีโอได้จากข้อความ (Text-To-Video) ได้ดูสมจริงมาก ๆ  โดยนักวิจัย Google Research, Weizmann Institute และ Tel Aviv University...

Google เปิดตัว “VideoPoet” โมเดล LLM ใหม่ ที่ออกแบบมาสำหรับงาน Generate วีดีโอโดยเฉพาะ

ล่าสุด Google ได้เปิดตัว “VideoPoet” โมเดล Multimodal AI ตัวใหม่ที่ใช้ LLM เป็นพื้นฐานสำหรับงาน Video Generator หรือการสังเคราะห์วีดีโอขึ้นมา ซึ่งโมเดลใหม่นี้สร้างโดยทีมนักวิจัยกว่า 31 ชีวิตที่ Google Research ดูตัวอย่างผลลัพธ์วีดีโอที่ได้จาก VideoPoet ของทาง Google ได้ที่นี่ มีจุดที่น่าสนใจ ตรงที่ Google...

นักวิจัยพบ Google Gemini ประสิทธิภาพยังสู้ GPT-3.5 Turbo เวอร์ชันเก่ายังไม่ได้ในหลาย ๆ งาน

หลังจาก Google ได้เปิดตัว Gemini ที่เคลมว่าเก่งกว่า GPT-4 แทบทุกด้านจนเป็นกระแสใหญ่อยู่ในช่วงหนึ่ง ล่าสุดอาจจะต้องรีบแก้เกมจริง ๆ เสียแล้ว หลังจากงานวิจัยใหม่พบว่าเวอร์ชันสุดยอดของ Gemini หรือ Gemini Pro นั้นก็ยังมีประสิทธิภาพที่ "ด้อยกว่า" GPT-3.5 ของ OpenAI ในหลาย ๆ งานที่ทำการทดสอบ หลายคนอาจจะนึกว่าเขียนผิดหรือไม่ ตรวจสอบจากแหล่งข้อมูลต้นทางแล้วก็ยังเน้นว่าไม่ผิดแน่นอนว่า...

Meta เปิดตัว “Audiobox” โมเดล AI โคลนเสียง เอาไปสังเคราะห์เสียงพูดได้ตามข้อความ Prompt

โมเดล Generative AI เรียกว่าร้อนแรงจริง ๆ ในช่วงเวลานี้ ซึ่งล่าสุดคือ Audiobox โมเดล AI ด้านเสียงล่าสุดที่ Meta เปิดตัวที่ออกมาในช่วงนี้ โดยสามารถโคลนเสียงพูด ทั้งโทน สไตล์ จังหวะ การเน้นเสียง แล้วเอาไปสังเคราะห์เสียงพูดได้ตามข้อความ Prompt  โดยโมเดล Audiobox นี้ "สามารถสังเคราะห์เสียงและ Sound...
Latest Articles