ในงานสัมมนาวิชาการ Computer Vision and Pattern Recognition ที่เมืองซอลท์เลคซิตี้ (Salt Lake City) รัฐยูท่าห์ (Utah) ทีมนักวิจัยจาก NVIDIA มหาวิทยาลัยแมตซาชูเสต แอมเฮิร์สท (University of Massachusetts Amherst) และมหาวิทยาลัยแคลิฟอร์เนีย (University of California) ร่วมกันรับรางวัล “Best Paper Honorable Mention Award” สำหรับงานวิจัยที่มีชื่อว่า “SPLATNet: Sparse Lattice Networks for Point Cloud Processing”
“พวกเรารู้สึกเป็นเกียรติอย่างยิ่งที่ได้รับรางวัลนี้ พวกเราตื่นเต้นและภูมิใจที่ได้รับการยอมรับในความพยายามของพวกเราในการส่งเสริมงานวิจัยที่สำคัญมากนี้” ทีมงานกล่าว
ในงานวิจัยตีพิมพ์ได้อธิบายถึงโครงสร้างสถาปัตยกรรม (architecture) ของระบบ deep learning ใหม่ที่ประมวลผลกลุ่มของจุดในรูปแบบสามมิติ (Point Cloud) โดยไม่ต้องมีการประมวลผลก่อนหน้า (pre-processing) โดย Point Cloud จะเก็บค่าตำแหน่งของขอบเขตวัตถุในพิกัด X, Y, Z ซึ่งตั้งใจที่จะใช้เป็นตัวแทนของวัตถุ 3 มิติหรือฉาก (scene) ต่างๆ โดยสิ่งนี้ถูกสร้างขึ้นมาเพื่อการสำรวจระยะทางไกล (remote sensing) และการทำแผนที่จากภาพถ่ายทางอากาศ (photogrammetry) ซึ่งเป็นวิทยาการในการวัดค่าจากภาพถ่ายต่างๆ ได้
หนึ่งในปัญหากับเรื่อง Point Cloud ก็คือการประกอบด้วยจุด 3 มิติที่เบาบางและกระจัดกระจายไปทั่ว สิ่งนี้ทำให้ยากที่จะใช้ระบบโครงข่าย Convolutional Neural Network แบบดั้งเดิมในการประมวลผล Point Cloud โดยไม่ต้องมีการทำขั้นตอน pre-processing ซึ่งจะต้องแปลงให้เป็น voxel หรือมุมมอง 2 มิติ ซึ่งโดยทั่วไปจะมีผลต่อวัตถุต่างๆ ในนั้นและส่งผลให้รายละเอียดของ Point Cloud หายไปได้
เพื่อแก้ไขปัญหาดังกล่าวนี้ ทีมงานได้ออกแบบโครงข่ายประสาทเทียม (Neural Network) ที่มีความยืดหยุ่น ซึ่งช่วยลดความท้าทายในงานบางอย่างด้วยสถาปัตกรรมของระบบ 3D deep learning ที่มีอยู่ปัจจุบัน
โดยทีมงานใช้เฟรมเวิร์ก Caffe เพื่อเทรน Neural Network บนข้อมูล dataset ที่หลากหลายทั้งภาพ 2 มิติและ Point Cloud 3 มิติ
“SPLATNet สามารถใช้ Point Cloud เป็นข้อมูล input ได้โดยตรง และประมวลผลตามลำดับขั้นและรับ feature ในตำแหน่งต่างๆ ด้วย lattice filter ที่มีประสิทธิภาพ” ทีมวิจัยเขียนในงานตีพิมพ์ของพวกเขา “SPLATNet ทำให้ง่ายต่อการจับคู่ข้อมูล 2 มิติไปสู่ข้อมูล 3 มิติ และอื่นๆ ซึ่งส่งผลให้กลายเป็นโครงสร้างสถาปัตยกรรมแบบใหม่สำหรับการประมวลผล Point Cloud และภาพที่เป็น multi-view”
ทีมยังกล่าวว่าโครงข่ายของพวกเขานั้นเปรียบเทียบแล้วได้ผลดีกว่าวิธีการอื่นๆ ที่เป็น state-of-the-art
โครงการในอนาคต ทีมงานต้องการที่จะค้นหาการใช้งานข้อมูล feature อื่นๆ มาเป็นข้อมูล input เพิ่มเติม เช่น ผิว texture ของอาคาร อีกทั้งเรื่องการใช้ high-dimensional lattice space อื่นๆ ซึ่งโค้ดของ SPLATNet นั้นอยู่บน GitHub แล้ว
Source : https://news.developer.nvidia.com/nvidia-splatnet-research-paper-wins-a-major-cvpr-2018-award/