Soli – một chip rada thu nhỏ dùng để phát hiện chuyển động và hiểu các tín hiệu phi ngôn ngữ đã được tiến hành phát triển sau 5 năm nghiên cứu. Nhóm nghiên cứu đằng sau dự án tìm hiểu những chi tiết cần và đủ để thiết kế một giao diện thực sự trực quan . Và đây mới chỉ là bước khởi đầu.
Bởi Lauren Bedal và Leonardo Giusti
Mọi người luôn phải học các hành vi mới để vận hành công nghệ.
Ví dụ: các chức năng cơ bản của máy tính như kéo và thả hoặc tương tác chuột và con trỏ không phải tự nhiên mà xuất hiện. Ngay cả những cử chỉ thông thường như chạm, vuốt và kéo cũng được làm mới và chuẩn hóa lại giữa thời đại điện thoại thông minh và máy tính bảng.
Khi công nghệ ngày càng hiện diện nhiều hơn trong cuộc sống, thật công bằng khi chúng ta bắt đầu yêu cầu công nghệ tiếp nhận thêm một vài gợi ý từ mình. Ý tưởng này là trọng tâm trong công việc của Dự án & Công nghệ tiên tiến (ATAP), một nhóm đa ngành tại Google, nhóm này đang tạo ra một mô hình tương tác hoàn toàn mới dựa trên các sắc thái chuyển động của con người – và lời hứa về một chip radar thu nhỏ có tên là Soli.
Dự án Soli bắt đầu cách đây hơn 5 năm, giờ đây đã xuất hiện (theo đúng tiêu chuẩn) trong điện thoại Pixel 4. Bản thân con chip này chỉ có kích thước 5mm x 6,5mm — bằng kích thước của một cục tẩy bút chì — và chứa một cảm biến có thể theo dõi chuyển động xung quanh điện thoại với tốc độ và độ chính xác rất cao. Với công nghệ này, bạn có thể bỏ qua bài hát hoặc báo lại báo thức chỉ bằng cử chỉ.
Và đó mới chỉ là sự khởi đầu
Soli có tiềm năng cung cấp cho các thiết bị của chúng ta một loại nhận thức mới — một cái gì đó tương tự như trí tuệ cảm xúc.
Làm cho điện thoại hoặc máy tính bảng của bạn được xã hội biết đến nhiều hơn là một thành tựu đòi hỏi một nhóm chuyên gia đa ngành. Mục tiêu của nhóm nghiên cứu ngay từ đầu là đặt câu hỏi về điều gì chính xác khiến một tương tác trở nên giống con người, hiểu rõ những tính năng đó và đối chiếu với trải nghiệm.
Họ bắt đầu bằng cách tập hợp một nhóm được tổ chức trên quy mô dự án. Điều này có nghĩa là tất cả mọi người — kỹ sư phần cứng và phần mềm, nhà khoa học nghiên cứu, nhà thiết kế, nhà công nghệ sáng tạo — đã làm việc cùng nhau từ những giai đoạn đầu tiên của R&D trở đi (và thường không làm việc trên các dự án khác trong danh mục đầu tư của ATAP). Cấu trúc này là chìa khóa để khám phá một công nghệ mới như radar, khi yêu cầu sản phẩm hoặc người dùng mục tiêu thậm chí còn chưa được xác định. Họ tin rằng các nhà thiết kế, đặc biệt, có thể mang lại cả sự sáng tạo và quan điểm nhân văn cho quy trình bằng cách giúp tạo không gian cho một công nghệ mới và khám phá các đặc tính nội tại của nó. Ngoài việc chạy thử nghiệm, nhóm thiết kế đã nghiên cứu sâu về giao tiếp phi ngôn ngữ, bằng cách nói chuyện với các chuyên gia trong các lĩnh vực đa dạng như Proxemics ( không gian giao tiếp) và Primatology( linh trưởng học). Khi làm như vậy, họ có thể tạo ra một không gian thiết kế và xác định các phẩm chất nền tảng của Soli.
🚀NGÔN NGỮ “NGẦM”
Nhóm nghiên cứu bắt đầu tìm hiểu hành vi cơ bản của con người trước tiên. Họ trở nên thích thú với thứ được gọi là hành vi ngầm, được định nghĩa một cách lỏng lẻo là “những chuyển động mà bình thường bạn không nghĩ đến”. Giống như ra hiệu cho một người nào đó đi trước bạn để xếp hàng hoặc vẫy tay chào một người bạn. Khi con người giao tiếp, họ thực hiện các cử động vô thức với cơ thể, thường là để củng cố thêm giao tiếp bằng lời nói. Nhà tâm lý học Katherine Nelson đã mô tả một cách đáng yêu đặc biệt cử động của bàn tay chúng ta là “một phương thức có ý nghĩa vô thức, được thể hiện một cách có ý thức”.
Vậy những động thái này đến từ đâu?
Ta được học hoặc được dạy?
Cuộc trò chuyện ban đầu với nhà linh trưởng học Frans de Waal đã cho chúng tôi cái nhìn sâu sắc về nguồn gốc của các hành vi bản năng của con người.
Động vật linh trưởng có hai cử chỉ cơ bản: cử động của bàn tay từ cơ thể ra bên ngoài (đẩy) để từ chối thức ăn hoặc đuổi người khác đi, và cử động của tay từ bên ngoài về phía cơ thể (kéo) để đòi thức ăn hoặc những thứ khác. . Vì những chuyển động này đã ăn sâu vào tâm khảm nên chúng cũng mang đầy ý nghĩa chia sẻ – bạn có thể dễ dàng nhận ra những hành động này trong chính mình hoặc người thân vào lần tới khi bạn đi ăn tối.
Dựa trên các hành vi ngầm, sau đó nhóm nghiên cứu có thể thiết lập các mẫu cử chỉ tương tác cho Soli.
Hãy xem thao tác vuốt, tiếp cận và nhấn.
Vuốt là một chuyển động ra khỏi cơ thể, tránh xa để loại bỏ một thứ gì đó. Chúng ta thấy những chuyển động tương tự khi ai đó đẩy đĩa thức ăn của họ ra khi đã đầy (hãy nhớ rằng chúng ta cũng là động vật linh trưởng) hoặc thực hiện chuyển động “vung” bằng tay nếu họ không muốn thứ gì đó.
Sau đó, vuốt để hoãn lại (swipe to snooze) là một chuyển động quét qua màn hình để phản ánh hành vi và ý định (một cách bẩm sinh). Đối với phạm vi tiếp cận thì ngược lại, nó báo hiệu sự bắt đầu của một tương tác. Chúng ta thấy những chuyển động tương tự khi ai đó với tay để lấy một món hàng trên kệ cửa hàng tạp hóa hoặc vươn tay để bắt tay ai đó. Cũng tương tự như khi bạn muốn bắt đầu tương tác với điện thoại của mình. Cử chỉ nhấn hơi khác một chút và được sử dụng để bắt đầu và dừng các hành động — chẳng hạn như phát nhạc. Chúng ta thấy các chuyển động như: khi ai đó giơ tay lên để “tạm dừng” một người đang nói hoặc khi bạn gõ vào vai ai đó để thu hút sự chú ý của họ. Trong mỗi trường hợp, những gì có vẻ giống như một tương tác đơn giản, thực sự chứa nhiều lớp (và hàng tháng) nghiên cứu và phát triển.
Ý tưởng ban đầu là tạo ra một cảm biến mới có khả năng nắm bắt những nét tinh tế của bàn tay con người, nhưng tầm nhìn của dự án đã sớm mở rộng, bao gồm giao tiếp phi ngôn ngữ rộng và bao gồm sự đa dạng của chuyển động của con người.
🚀TÍN HIỆU TỪ CUỘC SỐNG HẰNG NGÀY.
Nhận dạng cử chỉ chỉ là một phần nhỏ của những gì Soli có thể làm. Mục tiêu rộng hơn của nhóm là tạo ra một mô hình tương tác mới dựa trên sự hiểu biết về ngôn ngữ cơ thể và cử chỉ. Điều đó không có nghĩa là “cử chỉ” – đặc biệt là những cử chỉ không có khả năng thể hiện bằng xúc giác – rằng một sự thay đổi lớn hơn đang diễn ra.
Soli có khả năng đọc nhiều hơn cử chỉ hoặc các tương tác rõ ràng, bởi vì nó cũng có thể phát hiện ra các tín hiệu ngầm, như sự hiện diện và ngôn ngữ cơ thể. Cả hai có liên quan với nhau vì cả hai đều xử lý các chuyển động của cơ thể con người và khi được kết hợp cho phép tạo ra một khuôn khổ lấy cảm hứng từ cách mọi người thường tổ chức các tương tác xã hội của họ trong cuộc sống hàng ngày: chẳng hạn như tại quán bar hoặc bữa tiệc, khác với khi bạn ở nhà một mình và thư giãn trên đi văng. Soli, theo thiết kế, hiểu những gì đang xảy ra xung quanh thiết bị và do đó có khả năng diễn giải ý định của con người bằng cách di chuyển qua ba trạng thái khác nhau: nhận biết, tương tác, hoạt động.
Trong quá trình nghiên cứu, nhóm cũng tìm đến nhà lý thuyết khiêu vũ Rudolf von Laban, để hiểu rõ hơn khái niệm về thái độ cơ thể. Họ đã học được rằng cách chúng ta giữ cơ thể của mình, về tư thế và chuyển động, phản ánh ý định bên trong- và bằng cách hiểu và tận dụng từng sắc thái tinh tế, có thể xác định tốt hơn ý định của người dùng.
Ví dụ: Bạn bước vào phòng và có nhiều người xung quanh bạn, Soli trước tiên sẽ hiểu những gì đang xảy ra xung quanh thiết bị. Nếu muốn bắt chuyện với ai đó trong một căn phòng đông người, trước tiên bạn cần thu hút sự chú ý của họ. Soli cũng phân biệt như vậy, chờ đợi các dấu hiệu hành vi như tiếp cận hoặc nghiêng về phía điện thoại để tương tác và dự đoán những gì bạn sẽ làm tiếp theo.
Thậm chí, công nghệ vẫn chưa thực sự coi chúng ta là con người đang sống, đang thở – ít nhất là chưa. Có một bức vẽ nổi tiếng trong Máy tính vật lý của Dan O’Sullivan mô tả cách máy tính nhìn thấy chúng ta: về cơ bản là một ngón tay và một con mắt. Mặc dù nó đã được thực hiện vào năm 2004, hình ảnh vẫn còn khá tốt. Các thiết bị của nhóm hiểu rõ bối cảnh kỹ thuật số của chúng ta nhưng ít hiểu bối cảnh thực của chúng ta hơn. Với Soli, điều đó có thể thay đổi, để công nghệ của nhóm đạt được khả năng hiểu và “coi” chúng ta là con người.
🚀ĐỌC VỊ
Vùng khoảng cách cá nhân (personal distance) có thể là tiêu chí hàng đầu hiện nay, nhưng sự tác động qua lại gần gũi giữa ngôn ngữ cơ thể đã được nghiên cứu kỹ lưỡng. Giả định của ATAP là proxy- lĩnh vực nghiên cứu liên quan đến lượng không gian mà mọi người cảm thấy cần thiết để thiết lập giữa họ và những người khác – có thể được tận dụng để làm trung gian trong thiết kế tương tác mối quan hệ giữa chúng ta với công nghệ. Thông thường, mọi người mong đợi sự tương tác và sự thân mật ngày càng tăng khi họ tiếp cận những người khác, vì vậy điều tự nhiên là họ cũng mong đợi sự kết nối và tương tác với thiết bị của họ ngày càng tăng.
Cốt lõi của lý thuyết về proxemic, nhà nhân chủng học văn hóa Edward T. Hall xác định bốn không gian khác nhau:
Khoảng cách thân mật để ôm hôn, chạm vào hoặc thì thầm;
Khoảng cách cá nhân đối với các tương tác giữa những người bạn tốt hoặc gia đình;
Khoảng cách xã hội cho các tương tác giữa những người quen biết;
Khoảng cách công khai được sử dụng để nói trước đám đông.
Ví dụ điển hình về khoảng cách xã hội trong hành động là khi bạn đang ở trong thang máy — không gian có sự thay đổi liên tục khi ai đó mới bước vào hoặc bước ra, khi mọi người di chuyển để thích hợp với nhau.
Mọi người đều có ý thức cố hữu về cách thương lượng không gian, thậm chí không cần nghĩ đến nó. Là một người, bạn không cần phải học bất kỳ điều nào trong số này vì đó là những gì chúng ta thường làm. Tại ATAP, chúng tôi đang cố gắng hiểu cách chúng tôi có thể sử dụng sự hiểu biết về không gian trực quan này mà chúng tôi có với tư cách là con người — trong tương tác với một thiết bị.
Một thiết bị có thể học cách cư xử như vậy không?
Với Soli, dường như có thể làm cho công nghệ không chỉ thông minh hơn mà còn lịch sự hơn. Một thiết bị biết hoạt động ở mức âm lượng thấp hơn vì bạn đang ở gần hoặc đang nói thì thầm, thật sự đáng cân nhắc hơn. Và với sự hiểu biết về ngôn ngữ cơ thể, một thiết bị có thể phân biệt được thời điểm bạn đang nói chuyện trực tiếp với nó hay với những người khác trong phòng. Khi bạn trò chuyện với một người khác, bạn rất dễ hiểu khi nào nên bắt đầu và ngừng trò chuyện dựa trên hướng cơ thể và các dấu hiệu không gian của họ. Ngay bây giờ, loại tương tác này thực sự khó làm với công nghệ; đó là lý do tại sao bạn phải bắt đầu mọi cuộc trò chuyện với trợ lý bằng “Ok, Google”. Hãy tưởng tượng một thiết bị có đầy đủ hiểu biết về giao tiếp không lời của con người và tiềm năng của công nghệ này sẽ được chú ý.
🚀THÍCH ỨNG
Ngôn ngữ tương tác mới coi nhận thức cá nhân, xã hội và không gian chỉ là bước khởi đầu. Khi công nghệ phát triển, mục tiêu cuối cùng là các thiết bị thực sự hiểu chúng ta, vì vậy chúng ta không cần phải dành những khoảnh khắc quý giá để cố gắng giải thích bản thân. Điều này có nghĩa là sẽ tiết kiệm được thời gian hơn để quản lý công nghệ và những phiền toái mà nó mang lại trong cuộc sống của bạn. Thực hiện một việc đơn giản như tắt tiếng chuông báo thức. Ngay khi thức dậy, bạn phải với lấy điện thoại, nhấc nó lên, đưa nó lên mặt và tìm một nút nhỏ để nhấn. Khi bạn ở đó, bạn sẽ thấy một thông báo đẩy với tin tức mà bạn không thể bỏ qua hoặc có thể Twitter của bạn nhảy lên, và bạn sẽ sớm rơi vào hố sâu của cuộc sống kỹ thuật số – trước khi bạn rời khỏi giường.
Hãy tưởng tượng một tình huống khác khi bạn ở xa thiết bị của mình và các phần tử giao diện tự động xuất hiện lớn hơn, thu nhỏ lại khi bạn đến gần; trợ lý giọng nói của bạn cung cấp thêm thông tin mà không cần nhắc vì nó hiểu rằng bạn không thể nhìn thấy màn hình. Ngược lại, các mô hình mới có thể đồng nghĩa với việc chấm dứt những vi nhiệm nhỏ nhưng tốn thời gian này, chẳng hạn như bật và tắt điện thoại, khiến bạn ở trong thế giới kỹ thuật số lâu hơn bạn dự định. Và nó sẽ giải phóng chúng ta, chúng ta sẽ có nhiều thời gian hơn để kết nối với những người khác và thật sự hiện diện trong thế giới vật chất.
Cuối cùng, thậm chí Soli có khả năng học theo thời gian thực bằng các cử chỉ, do đó, máy có thể thích ứng và tương tác với bạn, với tư cách là một con người. Những gì chúng ta từng nghĩ về robot, sẽ mang một khái niệm mới. Quan trọng hơn, thế hệ tiếp theo của Soli có thể nắm bắt được vẻ đẹp và sự đa dạng của chuyển động tự nhiên của con người, vì vậy mỗi chúng ta có thể tạo ra cách riêng của mình để du lịch khắp thế giới bằng công nghệ – giống như chúng ta làm trong cuộc sống hàng ngày.