นักวิจัยที่ SK Telecom ได้สร้างวิธีการใหม่ที่ใช้ NVIDIA TensorRT ในการใช้กลไกอนุมาน (inference engine) deep learning ที่มีประสิทธิภาพสูง ที่ทำให้สามารถรู้จำวัตถุได้เร็วขึ้น ซึ่งวิธีการนี้สามารถนำไปใช้ในโครงการต่างๆที่หลากหลายรวมไปถึงการตรวจสอบติดตามผู้ป่วยในโรงพยาบาลหรือการมีพยาบาลดูแลที่บ้าน การวิเคราะห์ผู้เล่นเชิงลึกในกีฬาแต่ละประเภท หรือการช่วยให้เกิดการบังคับใช้กฎหมายกรณีที่มีการลักพาตัวเด็กหรือเด็กหายไปได้
วิธีการนี้ได้ถูกนำเสนอครั้งแรกที่งานสัมมนาวิชาการ GPU Technology Conference ในเมืองแซนโฮเซปีนี้ โดยมุ่งเน้นไปในการเพิ่มประสิทธิภาพในการตรวจจับบุคคล และการเพิ่มผลลัพธ์สำหรับแอปพลิเคชันอนุมาน (inference application) แบบ real time ซึ่งการเชื่อมต่อระบบของพวกเขาเข้ากับ TensorRT นั้นได้ผลลัพธ์ที่มีประสิทธิภาพสูงขึ้นกว่าจากเดิม 6 เท่า
“SIDNet รันได้ผลเร็วกว่า 6 เท่ากว่าวิํีธีต้นฉบับ YOLOv2 บน NVIDIA Testla V100 ด้วย INT8 ซึ่งยืนยันโดยตรวจสอบ SIDNet บน ข้อมูล dataset สำหรับ benchmark ต่างๆ กันไปในการทำ object detection และ intrusion detection” คุณ Shounan An วิศวกรด้านการเรียนรู้ของเครื่อง (machine learning) และการมองเห็นของคอมพิวเตอร์ (computer vision) ที่ SK Telecom กล่าว “การที่ประสิทธิภาพเพิ่มขึ้นถึง 6 เท่าในครั้งนี้ มาพร้อมกับสิ่งที่ต้องแลกไปซึ่งก็คือความถูกต้องที่ลดลงไปเพียง 1% เท่านั้น เมื่อเทียบกับโหมด FP32”

“TensorRT ทำให้มีความเร่งในการอนุมาน (inference acceleration) ได้ดีขึ้นโดยสามารถทำให้ความถูกต้องลดลงไปเพียงแค่ 1% เมื่อใช้ INT8 ได้ ด้วยประสิทธิภาพที่เพิ่มขึ้นจากวิธีการของ YOLO-v2 ซึ่งทำได้อย่างยอดเยี่ยมอยู่แล้วนั้นจึงมีความเป็นไปได้เหมือนกับเช่น NVIDIA ได้ปรับปรุง TensorRT” คุณ An กล่าว ซึ่งบล็อกทางเทคนิคได้เปิดเผยไปเมื่อวันก่อน ซึ่งทีมวิจัยยังได้ทดสอบในเรื่องของเวลาเพิ่มเติมด้วยขนาด batch size ที่หลากหลายและได้อธิบายรายละเอียดเพิ่มเติมไว้ในโพสที่นี่
Source : https://news.developer.nvidia.com/tensorrt-radically-improves-real-time-object-detection-by-6x/