โครงการ TensorFlow ได้ประกาศปล่อยเวอร์ชัน 2.3.0 ออกมาแล้ว ด้วยกลไกฟีเจอร์ใหม่ในการลดคอขวด (bottleneck) การใส่ข้อมูลเข้า pipeline ลงไป รวมทั้งชั้น Keras ในการทำ preprocessing และการ profiling หน่วยความจำ
จากบล็อคโพสล่าสุดของคุณ Josh Gordon ที่อธิบายถึงไฮไลท์ใน release ใหม่นี้ โดยแพ็กเกจ tf.data นั้นได้มี service API ใหม่ที่สามารถกระจายข้อมูลเข้า preprocessing ไปยัง cluster ที่ทำงานได้หลายเครื่องพร้อมกัน ซึ่งสามารถเพิ่ม throughput ของข้อมูลได้ในระหว่างการเทรน
นอกจากนี้ snapshot API นั้นยังสามารถเก็บผลลัพธ์ของการทำ preprocessing pipeline ไปยังดิสก์ได้ ซึ่งจะลดงานที่ต้องใช้ระหว่างการรันเทรนในภายหลังลงไป และด้วยการทดลองใหม่ที่นำเอา Keras Preprocessing Layer API มาใช้นั้นทำให้บางกระบวนงาน preprocessing สามารถนำรวมเข้าไปในการทำโมเดล deep learning ได้และทำให้นำโมเดลมาใช้งานได้ง่ายขึ้นอีกด้วย อีกทั้ง TF Profiler นั้นก็มีเครื่องมือใหม่ในการ profiling หน่วยความจำและการติดตาม Python เพื่อช่วยในการ debug ได้
อย่างไรก็ดี คู่แข่งหลักของ TensorFlow อย่าง PyTorch นั้นก็ได้ปล่อย release ล่าสุดออกมาเช่นกัน โดยหนึ่งในนั้นได้มี memory profiler อีกด้วย ซึ่งแม้ว่า TensorFlow จะยังคงกินส่วนแบ่งตลาดเป็นหลักในอุตสาหกรรมเมื่อช่วงปลายปีที่ผ่านมา แต่การพูดคุยกันใน Reddit เกี่ยวกับ release ใหม่นี้ก็ยังคงมีหลายๆ คอมเมนต์ที่แสดงถึงความน่าเบื่อหน่ายกับ TensorFlow หนึ่งในนั้นกล่าวว่า “ในฐานะที่เป็นผู้เชี่ยวชาญในอุตสาหกรรมคนหนึ่งและไม่ใช่นักวิจัย TensorFlow X นั้นยังคงเป็นเครื่องมือที่ยอดเยี่ยมและเป็นหนึ่งในจุดแข็งที่ใหญ่ที่สุด หากแต่ก็พบว่ามีคนพูดมากขึ้นเรื่อยๆ ในโลกออนไลน์ว่าเริ่มเบื่อ TensorFlow แล้ว”
Source : https://www.infoq.com/news/2020/08/tensorflow-improved-pipelines/