นักวิจัยด้านรัฐศาสตร์จาก UC San Diego ได้ทดลองพัฒนาระบบ AI จากวิกิพีเดียภาษาจีนฉบับที่ทั่วโลกเห็นเพื่อเทียบกับระบบ AI จาก Baidu Baike สารานุกรมที่อยู่ภายใต้การเซ็นเซอร์ของรัฐบาลจีน โดยจากการศึกษาพบว่าการเซ็นเซอร์โดยรัฐบาลเป็นเหตุให้มีอคติในระบบ AI ได้
คณะนักวิจัยพัฒนาระบบ AI ทั้งสองแบบโดยมีสมมติฐานว่าการเซ็นเซอร์คำหรือวลีบางอย่างอาจกระทบต่อการทำงานของอัลกอริทึม AI เช่น การใช้ภาษาของแชทบอทหรือผู้ช่วยอัจฉริยะ โดยผลการศึกษาเปรียบเทียบครั้งนี้ พวกเขาพบว่าอัลกอริทึมที่ได้รับข้อมูลจากสารานุกรมเวอร์ชันเซ็นเซอร์นั้น มีการทำงานที่แตกต่างออกไป เช่น การจัดกลุ่มคำว่า “ประชาธิปไตย” ให้อยู่ใกล้เคียงกับคำว่า “ความวุ่นวาย” ซึ่งเป็นคำในแง่ลบ ในขณะที่อัลกอริทึมที่พัฒนาขึ้นจาก Wikipedia นั้นจัดกลุ่ม “ประชาธิปไตย” ใกล้เคียงกับ “ความมั่นคง” ซึ่งเป็นคำในแง่บวก
เมื่อนักวิจัยนำอัลกอริทึมที่ได้พัฒนานี้ไปสร้างระบบ Sentiment Analysis ก็พบว่ามีการทำงานที่แตกต่างกัน เช่น คำว่า “เลือกตั้ง” “เสรีภาพ” และ “ประชาธิปไตย” จะได้คะแนนแง่บวกมากกว่าในอัลกอริทึมจาก Wikipedia ในขณะที่สำหรับเวอร์ชัน Baidu Baike นั้น คำว่า “สอดแนม” “การควบคุมทางสังคม” และ “CCP” จะได้คะแนนไปทางแง่บวก
อย่างไรก็ตาม คณะนักวิจัยกล่าวว่าการเซ็นเซอร์อาจไม่ใช่ต้นเหตุของอคติ หรืออาจมีปัจจัยอื่นๆร่วมด้วย เช่น การเซ็นเซอร์ตัวเองของผู้เขียนสารานุกรม Baidu Baike ความแตกต่างทางวัฒนธรรม หรือธรรมชาติของเนื้อหาในเว็บไซต์ของจีนและสากล
ทั้งนี้ทั้งนั้น งานวิจัยนี้ก็เป็นจุดเริ่มต้นของสาขาวิจัยเกี่ยวกับข้อมูลที่ถูกรัฐบาลกำกับดูแลและผลกระทบที่มีต่อ AI รวมไปถึงแสดงให้เห็นว่านโยบายของรัฐบาลนั้นสามารถส่งผลกระทบต่อการทำงานของเทคโนโลยีอย่าง AI ด้วย