Giới thiệu
Sự phát triển nhanh chóng của công nghệ đã mang lại những giải pháp đột phá trong lĩnh vực hỗ trợ người khiếm thị. Những công nghệ như “chạm âm thanh” của thiết bị FAD, OrCam và Envision không chỉ giúp cải thiện khả năng nhận thức môi trường xung quanh mà còn mang lại sự độc lập và tự tin trong cuộc sống hàng ngày. Hãy cùng khám phá cách những thiết bị này đang định hình tương lai cho cộng đồng người khiếm thị nhé.
YouTube video
Foveated Audio Device (FAD) – Công Nghệ “Chạm Âm Thanh”
FAD là một thiết bị tiên tiến tích hợp kính thực tế tăng cường (AR) với khả năng nhận diện và sonify (chuyển âm) các vật thể trong tầm nhìn của người dùng. Thiết bị này tạo ra các biểu tượng âm thanh đặc trưng khi phát hiện các vật thể, giúp người dùng mù và người khiếm thị nhận diện và định vị chính xác mà không cần nỗ lực nhiều.
Lợi ích của FAD
Giảm tải nhận thức: Cung cấp âm thanh thay vì lời nói mô tả, dễ hiểu hơn và yêu cầu ít thời gian đào tạo hơn.
Khả năng tích hợp với công nghệ hiện đại: Có thể được tích hợp dễ dàng với các công nghệ kính thông minh khác, tạo nền tảng cho sự phát triển của thiết bị hỗ trợ thị giác.
Quá trình thử nghiệm và kết quả
Nghiên cứu đã được tiến hành với 14 người tham gia, bao gồm 7 người mù hoặc có thị lực kém và 7 người sáng mắt được bịt mắt để làm nhóm đối chứng. Những người tham gia trải qua các nhiệm vụ tìm kiếm và nhận diện vật dụng trong hai tình huống: ngồi và đứng. Kết quả cho thấy:
Hiệu quả sử dụng FAD: Cả hai nhóm đều có thể sử dụng FAD để nhận diện và tiếp cận vật dụng với tỷ lệ thành công cao, gần tương đương với các phương pháp hỗ trợ khác như hướng dẫn qua giọng nói hoặc loa ngoài.
Giảm tải nhận thức: Thiết bị FAD không làm tăng đáng kể mức độ tải nhận thức của người dùng, điều này cho thấy sự dễ sử dụng và tiềm năng của công nghệ này trong việc hỗ trợ cuộc sống hàng ngày của người khiếm thị.
Thử thách: Một số thử thách bao gồm việc phân biệt âm thanh giữa các vật dụng tương tự nhau (như cốc và chai), nhưng điều này có thể được khắc phục bằng cách cải thiện sự đa dạng của các biểu tượng âm thanh.
Kết quả nghiên cứu
Khả năng tích hợp với kính thông minh: Thiết bị FAD có thể được tích hợp dễ dàng với công nghệ kính thông minh hiện đại, mở ra cơ hội sử dụng trong các sản phẩm công nghệ cao khác như OrCam hay Envision.
Lợi ích tiềm năng cho cộng đồng người khiếm thị: Với sự trợ giúp của âm thanh không gian, người mù có thể thực hiện các hoạt động hàng ngày một cách độc lập hơn, từ việc tìm kiếm đồ dùng trong nhà đến định vị các vật thể trong môi trường phức tạp.
Triển vọng tương lai
Nghiên cứu về công nghệ “chạm âm thanh” và thiết bị FAD đã chứng minh tiềm năng lớn trong việc hỗ trợ người mù tiếp cận không gian xung quanh một cách tự chủ. Những phát triển trong tương lai nên tập trung vào việc cải thiện độ chính xác của nhận diện vật thể và tối ưu hóa âm thanh để tạo ra trải nghiệm sử dụng tốt nhất.
OrCam – Công Nghệ Kính Thông Minh
OrCam MyEye là một thiết bị nhỏ gọn, sử dụng camera thông minh để nhận diện và đọc văn bản, nhận diện khuôn mặt và mô tả các đối tượng. Nó hoạt động hoàn toàn ngoại tuyến (offline), giúp đảm bảo tính riêng tư và có thể sử dụng ở bất cứ đâu.
Tính năng nổi bật của OrCam:
Đọc văn bản và nhận diện khuôn mặt: Hỗ trợ người dùng đọc sách, hóa đơn và xác định người quen chỉ bằng âm thanh.
Thiết kế nhỏ gọn, tiện lợi: Dễ sử dụng và có thể gắn vào gọng kính, giúp người dùng tiếp cận thông tin mà không cần sử dụng tay.
Envision – Trí Tuệ Nhân Tạo Trong Hỗ Trợ Thị Giác
Envision Glasses sử dụng AI để nhận diện văn bản, mô tả hình ảnh và kết nối người dùng với người hỗ trợ qua cuộc gọi video. Thiết bị này có thể đọc văn bản từ nhiều nguồn khác nhau và mô tả chi tiết về các đối tượng trong ảnh.
Điểm nổi bật của Envision:
Khả năng đọc văn bản đa ngôn ngữ: Giúp người dùng tiếp cận nội dung bằng nhiều ngôn ngữ khác nhau.
Tích hợp với các dịch vụ khác: Cho phép mở rộng tính năng và hỗ trợ qua ứng dụng di động.
So sánh giữa FAD, OrCam và Envision
Mỗi thiết bị đều có những điểm mạnh riêng biệt, nhưng chung quy lại, cả ba đều đóng vai trò quan trọng trong việc nâng cao khả năng nhận thức không gian và cải thiện sự độc lập của người khiếm thị.
Điểm chung:
Hỗ trợ qua âm thanh: Cả ba thiết bị đều sử dụng âm thanh để truyền tải thông tin, giúp người dùng nhận thức nhanh và hiệu quả.
Thiết kế hướng đến sự tiện lợi: Các thiết bị đều nhỏ gọn, dễ mang theo và sử dụng trong các hoạt động hàng ngày.
Điểm khác biệt:
OrCam: Tập trung vào khả năng nhận diện khuôn mặt và đọc văn bản với hoạt động ngoại tuyến (off-line).
Envision: Đẩy mạnh tích hợp AI để mở rộng chức năng và kết nối với người hỗ trợ.
FAD: Mang đến cách tiếp cận mới với việc sử dụng âm thanh không gian để nhận diện và định vị vật thể.
Kết luận
Công nghệ hỗ trợ thị giác đang mở ra nhiều cơ hội cho cộng đồng người mù và người khiếm thị, mang lại sự tự tin và khả năng tự lập trong cuộc sống hàng ngày. Các thiết bị như FAD, OrCam và Envision không chỉ là công cụ hỗ trợ mà còn là cầu nối giúp người khiếm thị hòa nhập với thế giới.
Tài liệu tham khảo
- Zhu, H.Y., et al. (2023). “An investigation into the effectiveness of using acoustic touch to assist people who are blind“. PLoS ONE, 18(10), e0290431.
- OrCam Technologies. OrCam MyEye – Công cụ hỗ trợ người khiếm thị. Website chính thức.
- Envision. Envision Glasses – Công nghệ AI hỗ trợ thị giác. Website chính thức.