26 อย่าใช้กราฟ 3 มิติ
แปล Data Visualization fundamental Claus O. Wilke
กราฟ 3 มิติ เป็นที่นิยมอย่างสูงในการนำเสนอทางธุรกิจ แต่ในหมู่นักวิชาการกลับไม่เป็นเช่นนั้นอะไรทำใมเหล่านักวิชาการไม่ใช้กราฟ 3 มิติในบทนี้เราจะมาพูดถึงเหตุผลในเรื่องนี้
26.1 ไม่ควรใช้กราฟ 3 มิติ
ซอฟต์แวร์การแสดงกราฟจากข้อมูลหลายโปรแกรมสามารถแปลงกราฟโดยเปลี่ยนองค์ประกอบกราฟิกของกราฟให้เป็นวัตถุสามมิติ โดยทั่วไปเราจะเห็นแผนภูมิวงกลมกลายเป็นดิสก์หมุนในพื้นที่แปลงบาร์กลายเป็นคอลัมน์และแปลงเส้นกลายเป็นแถบ โดยเฉพาะอย่างยิ่งในกรณีเหล่านี้มิติที่สามจะนำเสนอข้อมูลจริงใด ๆ ในรูปแบบ 3 มิติ มันแย่มากและควรลบออกจากคำศัพท์ของนักวิทยาศาสตร์ข้อมูล
ปัญหาเกี่ยวกับกราฟ 3 มิติ คือการฉายภาพวัตถุสามมิติเป็นสองมิติทำให้บิดเบือนข้อมูล ระบบการมองเห็นของมนุษย์พยายามที่จะแก้ไขความผิดเพี้ยนนี้เนื่องจากจะจับคู่ ภาพ 2 มิติกับภาพ 3 มิติกลับสู่ 3 มิติ อย่างไรก็ตามการแก้ไขนี้สามารถทำได้เพียงบางส่วนเท่านั้น ยกตัวอย่างเช่นลองทำแผนภูมิวงกลมอย่างง่ายที่มีสองส่วนหนึ่งอันแสดงถึง 25% ของข้อมูลและอีก 75% และหมุนวงกลมนี้(รูปที่ 26.1) ในขณะที่เราเปลี่ยนมุมที่เรากำลังดูพายขนาดของชิ้นดูเหมือนจะเปลี่ยนเช่นกัน โดยเฉพาะอย่างยิ่งชิ้น 25% ซึ่งอยู่ด้านหน้าของวงกลมนั้นมีขนาดใหญ่กว่า 25% เมื่อเราดูที่มุมจากมุมฉาก (รูปที่ 26.1a)
ปัญหาที่คล้ายกันเกิดขึ้นสำหรับกราฟ 3มิติ ประเภทอื่น รูปที่ 26.2 แสดงรายละเอียดของผู้โดยสารเรือไททานิคตามชั้นโดยสารและเพศโดยใช้บาร์ 3 มิติ เนื่องจากวิธีการจัดเรียงแท่งเทียบกับแกนแท่งจึงดูสั้นกว่าที่เป็นจริง ตัวอย่างเช่นมีผู้โดยสารทั้งหมด 322 คนที่เดินทางในชั้นที่ 1 แต่รูปที่ 26.2 แสดงให้เห็นว่าจำนวนนั้นน้อยกว่า 300 ภาพลวงตานี้เกิดขึ้นเนื่องจากคอลัมน์ที่เป็นตัวแทนของข้อมูลอยู่ห่างจากด้านหลังทั้งสองซึ่งเส้นสีเทาแนวนอน จะถูกวาด หากต้องการดูเอฟเฟกต์นี้ให้ลองขยายขอบด้านล่างของคอลัมน์ใดคอลัมน์หนึ่งจนมองเห็นเส้นสีเทาต่ำสุดซึ่งแสดงถึง 0 จากนั้นลองจินตนาการถึงการทำแบบเดียวกันกับขอบด้านบนใด ๆ และคุณจะเห็นว่าคอลัมน์ทั้งหมด สูงกว่าที่ปรากฏในแวบแรก (ดูรูปที่ 6.10 ในบทที่ 6 สำหรับรูปแบบ 2D ที่สมเหตุสมผลมากขึ้นของรูปนี้)
26.2 กราฟ 3 มิติทำให้ขนาดของสัดส่วนผิดเพี้ยน
การสร้างกราฟ 3 มิติ โดยทั่วไปง่ายต่อการทำให้เข้าใจผิด มันทำให้ความจัดเจนในการแสดงข้อมูลลดลงในตำแหน่งของแกน X และ Y หรือ Z ในกรณีถ้าเราต้องการแสดงข้อมูลสามมิติมันยากที่จะหลีกเลี่ยงปัญหานี้สิ่งเดี่ยวที่ทำได้คือคิดเสมอว่าควรระวัง
พิจารณา scatter plot 3 มิติ ที่แสดงถึงน้ำมันเชื้อเพลิง เปรียบเทียบกับระยะทางสำหรับรถยนต์ 32 คัน เราได้เห็นชุดข้อมูลนี้ก่อนหน้านี้ในบทที่ 2 รูปที่ 2.5 ที่นี่เราวางแผนการเคลื่อนที่ตามแนวแกน x กำลังตามแกน y และประสิทธิภาพการใช้เชื้อเพลิงตามแนวแกน z และเราเป็นตัวแทนของรถยนต์แต่ละคันด้วยจุด (รูปที่ 26.3) แม้ว่าการสร้างภาพสามมิตินี้แสดงจากมุมมองที่แตกต่างกันสี่มุมมอง แต่ก็เป็นการยากที่จะจินตนาการว่าการกระจายจุดในช่องว่างเป็นอย่างไร พบว่าบางส่วน (d) ของรูปที่ 26.3 โดยเฉพาะอย่างยิ่งทำให้เกิดความสับสน มันเกือบจะแสดงชุดข้อมูลที่แตกต่างกันแม้ว่าจะไม่มีอะไรเปลี่ยนแปลงนอกจากมุมที่เรามองจุดต่างๆ
ปัญหาพื้นฐานของการสร้างภาพสามมิติอาจแก้ไขได้โดยแสดงข้อมูลออกเป็นสองกราฟต่อเนื่องกัน กราฟแรกแสดงข้อมูลดังที่ได้กล่าวไว้ในบทที่ 2 และ 3 ในบริบทของการปรับตำแหน่ง กราฟที่สองจับคู่ข้อมูลจากพื้นที่การสร้างภาพ 3 มิติลงในพื้นที่ 2D ของรูปสุดท้าย (กราฟที่สองนี้ไม่ได้เกิดขึ้นสำหรับการสร้างภาพที่แสดงในสภาพแวดล้อม 3 มิติจริงเช่นเมื่อแสดงเป็นรูปปั้นทางกายภาพหรือวัตถุที่พิมพ์ด้วย 3Dการสร้างภาพ 3 มิติที่แสดงบนจอแสดงผล 2 มิติ) กลับด้านได้เนื่องจากแต่ละจุดบนจอแสดงผล 2D สอดคล้องกับบรรทัดของจุดในพื้นที่การสร้างภาพ 3 มิติ ดังนั้นเราจึงไม่สามารถกำหนดได้ว่าจุดข้อมูลใดอยู่ในพื้นที่ 3D โดยเฉพาะ
ระบบการรับรู้ของเรายังพยายามแปลงกราฟ 3D เป็น 2D อย่างไรก็ตามกระบวนการนี้ไม่น่าเชื่อถือเต็มไปด้วยข้อผิดพลาดและขึ้นอยู่กับตัวชี้นำที่เหมาะสมในภาพที่ถ่ายทอดความรู้สึกสามมิติบางอย่าง เมื่อเราลบตัวชี้นำเหล่านี้การผกผันจะเป็นไปไม่ได้อย่างสิ้นเชิง สามารถดูได้ในรูปที่ 26.4 ซึ่งเหมือนกับรูปที่ 26.3 ยกเว้นความหมายทั้งหมดได้ถูกลบออก ผลที่ได้คือการจัดเรียงคะแนนแบบสุ่มสี่จุดที่เราไม่สามารถตีความได้เลยและไม่สามารถสัมพันธ์กันได้อย่างง่ายดาย เราสามารถบอกได้ว่าจุดใดในส่วน (a) สอดคล้องกับจุดใดในส่วน (b) แน่นอนฉันไม่สามารถ
แทนที่จะใช้การแปลงข้อมูลสองแบบแยกกันซึ่งหนึ่งในนั้นไม่สามารถย้อนกลับได้ จะดีกว่าที่จะใช้กราฟที่เหมาะสมกลับด้านที่เหมาะสมและแมปข้อมูลลงในพื้นที่ 2D โดยตรง ไม่จำเป็นต้องเพิ่มมิติที่สามเป็นสเกลตำแหน่งเนื่องจากตัวแปรยังสามารถสร้างลงในสีขนาดหรือสเกลรูปร่างได้ ตัวอย่างเช่นในบทที่ 2ตัวแปรห้าชุดของชุดข้อมูลประสิทธิภาพการใช้เชื้อเพลิงในครั้งเดียว แต่ใช้เพียงสองระดับตำแหน่งเท่านั้น (รูปที่ 2.5)
ก่อนอื่นถ้าเราใส่ใจเกี่ยวกับประสิทธิภาพการใช้เชื้อเพลิงเป็นหลักเป็นตัวแปรตอบสนองเราสามารถพล็อตมันสองครั้งครั้งหนึ่งต่อการกำจัดและต่อพลังงาน (รูปที่ 26.5) ประการที่สองหากเราสนใจว่าการกระจัดและพลังงานสัมพันธ์กันอย่างไรด้วยประสิทธิภาพการใช้เชื้อเพลิงในฐานะตัวแปรรองที่น่าสนใจเราสามารถวางแผนพลังงานกับการกำจัดและแผนที่ประสิทธิภาพการใช้เชื้อเพลิงตามขนาดของจุด (รูปที่ 26.6) ตัวเลขทั้งสองมีประโยชน์มากกว่าและสับสนน้อยกว่ารูปที่ 26.3
ปัญหาเกี่ยวกับแผนการกระจายแบบสามมิติคือการแสดงข้อมูลจริงจุดต่าง ๆ ไม่ได้แสดงข้อมูล 3 มิติด้วยตนเอง ตัวอย่างเช่นเกิดอะไรขึ้นถ้าเราใช้แถบ 3D แทน? รูปที่ 26.7 แสดงชุดข้อมูลทั่วไปที่หนึ่งอาจเห็นภาพด้วยแถบ 3 มิติอัตราการเสียชีวิตในปี 1940 ในเวอร์จิเนียแบ่งชั้นตามกลุ่มอายุและตามเพศและที่อยู่อาศัย เราจะเห็นได้ว่าจริง ๆ แล้วแถบ 3 มิติช่วยให้เราตีความพล็อต มันไม่น่าเป็นไปได้ที่คน ๆ หนึ่งจะเข้าใจผิดว่าแถบที่อยู่เบื้องหน้านั้นมีแถบที่อยู่ด้านหลังหรือในทางกลับกัน อย่างไรก็ตามปัญหาที่กล่าวถึงในบริบทของรูปที่ 26.2 มีอยู่ที่นี่เช่นกัน เป็นการยากที่จะตัดสินว่าแต่ละแท่งสูงเท่าไรและเป็นการยากที่จะทำการเปรียบเทียบโดยตรง ตัวอย่างเช่นอัตราการตายของผู้หญิงในเมืองในกลุ่มอายุ 65–69 ปีสูงกว่าหรือต่ำกว่าเพศชายในเมืองในกลุ่มอายุ 60–64 ปีหรือไม่
โดยทั่วไปจะดีกว่าถ้าใช้ Trellis (บทที่ 21) แทนการสร้างภาพ 3 มิติ ชุดข้อมูลการตายในเวอร์จิเนียต้องการเพียงสี่พาเนลเมื่อแสดงเป็นพล็อต Trellis (รูปที่ 26.8) ตัวเลขนี้ชัดเจนและง่ายต่อการตีความ เป็นที่ชัดเจนในทันทีว่าอัตราการตายสูงกว่าในผู้ชายมากกว่าผู้หญิงและผู้ชายในเขตเมืองก็ดูเหมือนว่าจะมีอัตราการตายสูงกว่าผู้ชายในชนบท แต่ไม่มีแนวโน้มดังกล่าวสำหรับผู้หญิงในเมืองและในชนบท
26.3 การใช้กราฟสามมิติที่เหมาะสม
อย่างไรก็ตามการแสดงภาพด้วย 3D บางครั้งอาจเหมาะสม ก่อนอื่นปัญหาที่อธิบายในส่วนก่อนหน้านี้มีความกังวลน้อยกว่าหากการสร้างภาพข้อมูลเป็นแบบโต้ตอบและสามารถหมุนได้โดยผู้ชมหรืออีกทางเลือกหนึ่งหากแสดงใน VR หรือสภาพแวดล้อมความเป็นจริงที่สามารถตรวจสอบได้จากหลายมุม ประการที่สองแม้ว่าการสร้างภาพข้อมูลไม่ได้เป็นแบบโต้ตอบแสดงให้เห็นว่าการหมุนช้าๆแทนที่จะเป็นภาพนิ่งจากมุมมองเดียวจะช่วยให้ผู้ชมมองเห็นว่าในพื้นที่ 3 มิติมีองค์ประกอบกราฟิกที่แตกต่างกันอยู่ สมองมนุษย์ดีมากในการสร้างฉาก 3 มิติใหม่จากชุดภาพที่ถ่ายจากมุมที่แตกต่างกันและการหมุนภาพช้าๆของภาพทำให้ได้ภาพเหล่านี้อย่างแน่นอน
มันดูสมเหตุสมผลที่จะใช้การสร้างภาพ 3 มิติเมื่อเราต้องการแสดงวัตถุ 3 มิติที่แท้จริงและ / หรือข้อมูลที่แมปไว้ ตัวอย่างเช่นการแสดงความโล่งอกภูมิประเทศของเกาะภูเขาเป็นตัวเลือกที่สมเหตุสมผล (รูปที่ 26.9) ในทำนองเดียวกันถ้าเราต้องการเห็นภาพการอนุรักษ์ลำดับวิวัฒนาการของโปรตีนที่แมปไว้บนโครงสร้างของมันมันก็สมเหตุสมผลที่จะแสดงโครงสร้างเป็นวัตถุ 3 มิติ (รูปที่ 26.10) อย่างไรก็ตามในทั้งสองกรณีการสร้างภาพข้อมูลเหล่านี้ยังคงง่ายต่อการตีความหากแสดงเป็นภาพเคลื่อนไหวแบบหมุน แม้ว่าสิ่งนี้จะเป็นไปไม่ได้ในสิ่งพิมพ์สิ่งพิมพ์แบบดั้งเดิม แต่ก็สามารถทำได้อย่างง่ายดายเมื่อโพสต์ตัวเลขบนเว็บหรือเมื่อมีการนำเสนอ
References
Molyneaux, L., S. K. Gilliam, and L. C. Florant. 1947. “Differences in Virginia Death Rates by Color, Sex, Age, and Rural or Urban Residence.” American Sociological Review 12: 525–35.
Marcos, M. L., and J. Echave. 2015. “Too Packed to Change: Side-Chain Packing and Site-Specific Substitution Rates in Protein Evolution.” PeerJ 3: e911.
อ่านบทอื่นๆได้ที่
2 .Visualizing data: การเเสดงข้อมูลอย่างมีศิลปะ
3 การแสดงข้อมูลในรูปพิกัดและแกน
7 การแสดงการแจกแจง: ฮิสโตแกรมและ density plots
8 การแสดงภาพการแจกแจง: ฟังก์ชันการแจกแปล แจงสะสมเชิงประจักษ์และq-q Plots
9 -การแสดงข้อมูลหลายตัวแปลในรูปเดี่ยว
11 การแสดงสัดส่วนข้อมูลที่ซ้อนกัน
12 การแสดงข้อมูลโดยเชื่อมโยงระหว่างตัวแปรเชิงปริมาณตั้งแต่สองตัวขึ้นไป
13 การแสดงข้อมูลอนุกรมเวลาและฟังก์ชั่นของตัวแปรอิสระ
15 การแสดงข้อมูลเชิงภูมิศาสตร์
17 หลักการแสดงข้อมูลที่เป็นสัดส่วน
18 การจัดการข้อมูลที่ซ้อนกันในการแสดงข้อมูล
19 ข้อผิดพลาดที่พบได้บ่อยเมื่อใช้สีแสดงข้อมูล
21 การแสดงข้อมูลหลายกราฟในรูปเดียว
22 ชื่อเรื่อง Captions และตาราง
23 การสร้างสมดุลระหว่างข้อมูลและบริบทแวดล้อมในการแสดงข้อมูล
24 การใช้ labels ที่มีขนาดใหญ่
25 หลีกเลียงการใช้เส้นในการสร้างกราฟ