Tại sao Trợ lý giọng nói kỹ thuật số đang suy giảm:Xu hướng và thông tin chi tiết

Sự sụp đổ của trợ lý giọng nói kỹ thuật số

Cập nhật:ngày 12 tháng 12 năm 2023

Tôi không phải là người cay nghiệt. Tôi không có niềm tự hào. Nhưng đôi khi, tôi cũng tận hưởng khoảnh khắc thú vị khi nói "Tôi đã bảo rồi mà". Suy cho cùng, khi, trong cuộc đời làm kỹ thuật viên tại một công ty công nghệ, đôi khi bạn bị buộc phải nghe các bài giảng về tương lai, với những từ như DevOps và AI/ML được ném vào máy xay, bởi những nhà quản lý "được truyền cảm hứng", những người chỉ đọc về những điều mới mẻ và thú vị trên bản tóm tắt Linkedin của họ giữa các cuộc họp quan trọng, thì việc người ta cảm thấy được minh oan khi mọi thứ chắc chắn diễn ra như chúng phải diễn ra là điều tự nhiên. Điển hình là thực tế phi thực tế của trợ lý kỹ thuật số.

Trong khoảng một năm qua, đã có nhiều báo cáo và câu chuyện về việc trợ lý kỹ thuật số không mang lại lợi nhuận, dẫn đến việc loại bỏ các nhóm và công nghệ có liên quan. Ngày xửa ngày xưa, Siri, Cortana và Alexa đều là những cơn thịnh nộ, còn bây giờ thì không. Đối với tôi, kết quả này đã rõ ràng ngay từ đầu. Tôi chỉ phải đợi vài năm để một lần nữa chắc chắn được chứng minh là đúng. Hãy để tôi nói lý do tại sao.

Công nghệ không có mục đích

Tại sao, tại sao, tại sao, tại sao, tại sao. Đó là câu hỏi mà người ta nên hỏi, thật buồn nôn, bất cứ khi nào ai đó đưa ra một công nghệ mới hoặc đề xuất một sự thay đổi mới sẽ "cách mạng hóa" cuộc sống. Đầu tiên, các cuộc cách mạng đều liên quan đến những cuộc đổ máu lớn và bi kịch, nên không. Thứ hai, cuộc sống tự tối ưu hóa như nó vốn có, nó không cần những kẻ gây rối loạn triệt để (ngoại trừ Cardassian). Thứ ba, nếu người đề xuất thay đổi hoặc công nghệ có thể trả lời tất cả các câu hỏi tại sao của bạn mà không nói lắp, thì có thể họ đã làm được điều gì đó.

Đó không phải là điều tôi nhận được mỗi khi câu chuyện về trợ lý kỹ thuật số hoặc AI được nhắc đến. Tất cả những gì tôi nghe được gần như ở cấp độ sùng bái là "có thể cải thiện cuộc sống của bạn", "đơn giản hóa nhiệm vụ", "đặt sữa cho bạn" và các từ thông dụng IoT tương tự mà không thực sự có vấn đề gì. Trên thực tế, kịch bản duy nhất tôi từng thấy là như sau:

Một video dài 3 phút, hơi bão hòa chiếu cảnh một nhân viên tiếp thị kiêm công nghệ cao, bận rộn (tất nhiên là ở Mỹ), với một chiếc dongle Bluetooth bên tai, kể về cuộc sống bận rộn, cuộc sống thượng lưu của họ. Họ còn trẻ, độc thân và không thể nấu ăn nếu cuộc sống bận rộn, thượng lưu của họ phụ thuộc vào nó. Họ có quá nhiều cuộc gặp gỡ để diễn ra cuộc sống bình thường. Thế là họ quên mua sữa! Hừ! Vì vậy, bây giờ, khi đang lái xe về nhà, họ "gọi" trợ lý kỹ thuật số của mình và trợ lý sẽ lo mọi việc. Nó bật điều hòa từ xa và đặt mua sữa cho bạn, và khi họ hoàn thành việc vượt qua 2,5 giờ kẹt xe (vì phương tiện công cộng dành cho người nghèo) đến studio đắt đỏ của họ, sữa vẫn ở đó chờ họ, thư giãn.

Và ... thế thôi. Đây gần như là điều duy nhất tôi từng được xem. Hoặc có thể là những biến thể nhỏ như đồng hồ báo thức, đời sống âm nhạc, những thứ vô nghĩa tầm thường chẳng có gì khác biệt ngoài việc trở thành một mánh lới quảng cáo thú vị và lạ mắt như một bộ phim khoa học viễn tưởng sáo rỗng nào đó từ những năm 1960.

Tại sao Trợ lý giọng nói kỹ thuật số đang suy giảm:Xu hướng và thông tin chi tiết

Nguồn:Ảnh của Jacek Dylag trên Bapt.

Tôi chưa bao giờ thấy trợ lý kỹ thuật số được đề xuất cho những việc có ý nghĩa, như giúp đỡ người khuyết tật hoặc người già, giúp đỡ những người cô đơn, giúp đỡ người lao động trong môi trường cường độ cao và/hoặc dây chuyền sản xuất. Nhưng tôi đoán điều đó không hào nhoáng bằng một người đeo tai Bluetooth.

Nói một cách hoàn toàn hoài nghi sang một bên, nó vốn dĩ là một lời nhắc nhở tàn nhẫn rằng ... bạn không đủ giàu để có một trợ lý thực sự, một con người, người có thể lo liệu mọi công việc hàng ngày của bạn. Đó thực sự là những gì các nhà sản xuất quyền lực thực sự có. Trợ lý của con người, người giúp đỡ những công việc trần tục. Hãy xem bất kỳ VP, SVP, CXO nghiêm túc nào, hoặc bất kỳ ai, họ sẽ có một hoặc hai người theo sau. Còn ở nhà có thể có đầu bếp, người giúp việc, người dọn hồ bơi, ai mà biết được.

Được thiết kế bởi những người mọt sách dành cho những người bình thường

Bây giờ, vấn đề thứ hai và có thể còn lớn hơn là trợ lý kỹ thuật số không nói được ngôn ngữ của người dùng. Đồng bằng và đơn giản. Được cho là có, bạn có thể sử dụng các từ và cụm từ "ngôn ngữ tự nhiên" để yêu cầu hộp kỹ thuật số của mình làm điều này hoặc điều kia, nhưng nó chỉ hoạt động cho những điều cơ bản. Giống như sữa.

Nếu bạn muốn trợ lý thực sự làm việc cho mình, bạn cần có bộ óc của một lập trình viên và bạn cần hướng dẫn nó bằng một bộ điều kiện if-then mã giả, nếu không nó sẽ thất bại trong nhiệm vụ của mình. Ví dụ, tôi muốn mua một chiếc máy tính xách tay. Nhưng tôi không có bất cứ điều gì rõ ràng trong đầu cho đến khi tôi dành vài giờ để đọc, duyệt, so sánh các thiết bị, đọc đánh giá của con người, kiểm tra các chi tiết rất cụ thể.

Bây giờ, làm thế nào để bạn dịch nó sang máy? Tìm cho tôi một chiếc laptop phù hợp với sở thích của tôi? Không. Bạn cần nói những điều như:Tôi muốn một chiếc máy tính xách tay 14 inch, màn hình 400nits, tốt nhất là có tỷ lệ 16:10 và độ phân giải 2-4K, bộ xử lý có thể là AMD hoặc Intel, hầu hết có thể là tầm trung, pin rời, v.v. Điều này thật mệt mỏi, đặc biệt nếu bạn phải đập nó ra khỏi đỉnh đầu. Hoặc bạn có thể viết ra tất cả các yêu cầu của mình, điều đó có nghĩa là bạn không cần trợ lý để bắt đầu. Bạn không tiết kiệm được thời gian. Và bạn cũng có thể tự mình làm điều đó một lần mà không cần làm thêm bài tập về nhà, buộc máy phải làm điều gì đó mà dù sao thì bạn cũng sẽ cần phải kiểm tra và xác minh. Quy tắc số 1:không có đường tắt. Bạn không thể tiết kiệm thời gian. Đó là bs.

Tại sao Trợ lý giọng nói kỹ thuật số đang suy giảm:Xu hướng và thông tin chi tiết

Trợ lý "AI" của bạn sau khi nghe nhu cầu của bạn. Nguồn:Ảnh của Rock'n Roll Monkey trên Bapt.

Thị trường không đáng tin cậy

Tiếp theo, giả sử bạn có thể soạn một truy vấn siêu phức tạp và giả sử máy có thể hiểu và diễn giải yêu cầu của bạn một cách đáng tin cậy (điều mà máy thường không thể làm được, ngay cả bằng các giọng tiếng Anh khu vực khác nhau, chứ chưa nói đến tiếng nước ngoài), thì ... thì sao. Máy đi đâu để mua phần cứng cần thiết?

Vấn đề lớn là không có thị trường nào thực sự đáng tin cậy 100%. Dù bạn đi đâu, trực tuyến, ngoài đời thực, bạn sẽ cần phải kiểm tra đi kiểm tra lại mọi thứ. Ngay cả khi không có ác ý, mọi người vẫn có thể mắc sai lầm, dán nhãn sai cho sản phẩm, bạn có thể bỏ sót một chi tiết nhỏ hoặc thay đổi ý định. Có hàng nghìn biến thể và những nghịch lý nho nhỏ trong cuộc sống hàng ngày của chúng ta mà chúng không thể được mã hóa một cách đáng tin cậy để đưa vào máy và mong đợi bất kỳ loại kết quả bình thường nào. Con người vốn không thể đoán trước được, đặc biệt là ở cấp độ cá nhân.

Không có chuỗi tin cậy, không có chuỗi chính xác. Bạn có mù quáng để bất cứ ai - và ý tôi là bất kỳ ai, con người hay máy móc, thực hiện bất kỳ hình thức mua số tiền lớn nào cho bạn một cách mù quáng mà không có bất kỳ xác minh nào. Nhai kẹo cao su thì chắc chắn rồi, nhưng đồ nội thất, đồ điện tử thì sao? Không thể nào.

Tôi thấy ngạc nhiên khi các giám đốc điều hành ngạc nhiên rằng công nghệ của họ không mang lại kết quả đáng kinh ngạc. Mọi người sẽ sử dụng những trợ lý này cho những việc tầm thường hoặc mua hàng tầm thường và họ chưa bao giờ thực sự thiết lập bất kỳ loại mô hình có thể lặp lại và có thể dự đoán được nào (loại điều mà những người bán hàng yêu thích - mua hàng định kỳ). Trên hết, cộng thêm các vấn đề về ngôn ngữ-văn hóa, sự khác biệt lớn về mức độ sẵn sàng của cơ sở hạ tầng chuỗi cung ứng ở nhiều quốc gia khác nhau, sự phát triển của các cửa hàng trực tuyến, khả năng giao hàng tận nơi, chi phí vận hành và cuối cùng là bản chất thô sơ của con người, và bạn sẽ có một mô hình không hoạt động.

Con người thích mua sắm

Vì bất kỳ lý do sinh học nào, con người thực sự thích đầu tư thời gian để có được hàng hóa. Có thể là thực phẩm, quần áo, đồ điện tử, ô tô hoặc đồ nội thất, mọi người thích thêm dấu ấn của riêng mình vào những đồ vật này thông qua những quyết định cá nhân nhỏ nhặt, bởi vì đó là điểm khác biệt của chúng ta với máy móc. Nếu bạn muốn trang trí phòng khách của mình, chắc chắn bạn có thể mua những món đồ có sẵn từ đâu đó như IKEA, nhưng mỗi ngôi nhà sẽ khác nhau và sẽ mất rất nhiều thời gian và công sức để thêm các chi tiết cá nhân vào những thứ chung chung, vô hồn.

Khi bạn mua thực phẩm, chắc chắn bạn sẽ mua những thứ cơ bản giống nhau, nhưng một ngày nào đó, bạn sẽ mua bánh mì A và bánh kia cho bánh mì B, và có thể một ngày nào đó bạn sẽ thử mì ống, và ai mà biết được. Đó là vẻ đẹp hỗn loạn của bản chất con người và nó không thể được thuật toán hóa. Ngay cả những người bận rộn, khi mua sắm trực tuyến, họ VẪN sẽ đầu tư thời gian để tìm ra thứ mình cần. Có lẽ họ sẽ tiết kiệm được thời gian đến cửa hàng và giao hàng thực tế, nhưng phần giữa vẫn còn và đó phải là con người. Nhưng đó chính xác là những gì trợ lý kỹ thuật số hứa hẹn sẽ làm.

Tại sao Trợ lý giọng nói kỹ thuật số đang suy giảm:Xu hướng và thông tin chi tiết

Tín dụng:Ảnh của Atharva Tulsi trên Bapt.

Vì vậy, chúng tôi quay trở lại giải pháp ban đầu mà thực sự không có vấn đề gì. Trợ lý kỹ thuật số đã được quảng cáo tại một số công ty vô hồn, người quá bận rộn để tận hưởng cuộc sống và người có thể được duy trì thông qua mạng lưới mua hàng dự đoán không tưởng với thành công và đảm bảo 100%. Điều đã xảy ra là, cả người bình thường và những người đam mê công nghệ đều phải dùng thử hàng hóa, nhận ra rằng họ phải đầu tư cùng một lượng thời gian mà thông thường họ cần để đáp ứng nhu cầu của mình, chỉ theo một cách hơi khác một chút, họ nhận ra rằng họ quá yêu tiền của mình nên không thể giao phó nó cho một chiếc hộp biết nói, họ nhận ra rằng việc mua những mặt hàng đắt tiền phức tạp và khó đoán hơn nhiều so với vẻ ngoài của họ, các cửa hàng trực tuyến thực sự không thể được tin cậy một cách mù quáng và ... tất cả chỉ là vớ vẩn.

Có lẽ kịch bản hoạt động trong một môi trường vô trùng của một bộ phim khoa học viễn tưởng, không phải trong thế giới thực với những người giận dữ, ùn tắc giao thông, những quyết định kỳ lạ, hàng tấn sản phẩm giả ở khắp mọi nơi, và sau đó là một số. Cuối cùng, đừng quên ý nghĩa LỚN về quyền riêng tư của việc cho hộp thoại biết khá nhiều điều về bản thân bạn, bao gồm lịch trình hàng ngày rất chính xác, thói quen mua hàng và ai biết được điều gì khác.

Kết luận

Tôi khá hài lòng với kết quả. Không vui khi những người làm việc trên các công nghệ này thấy ý tưởng và sản phẩm của họ bị lãng phí, nhưng này, hãy đổ lỗi cho ban quản lý vui vẻ với từ thông dụng. Nghĩ đến các ví dụ cụ thể, tôi đã dành rất nhiều thời gian và sự tức giận để vô hiệu hóa Trợ lý Google trên các điện thoại Android khác nhau của mình đến mức tôi rất vui khi thấy nó bị loại bỏ, biến mất, bất kể điều gì. Nó chẳng phục vụ mục đích gì cho tôi ngoài việc làm tôi khó chịu và tốn thời gian vô hiệu hóa nó.

Các trợ lý kỹ thuật số về cơ bản sẽ làm bạn kém hiệu quả hơn. Họ thực sự không thể làm bất kỳ điều gì bạn cần, vì vậy họ chỉ đơn thuần là người phiên dịch những suy nghĩ của bạn mà bạn cần diễn đạt thành tiếng bằng ngôn ngữ được thiết kế cho máy. Giống như người quản lý dự án tư vấn bên ngoài cho một dự án đã có người quản lý dự án do công ty chỉ định. Nếu có thì đó là một nghi thức vô nghĩa khi bạn là người phục vụ chiếc hộp chứ không phải ngược lại. Rất mỉa mai nếu bạn nghĩ về nó. Nhưng tôi đoán cuối cùng vẫn có chút hy vọng cho nhân loại. Ngay cả những người bình thường cũng không chấp nhận điều đó, nên có lẽ chúng ta không ngu ngốc như chúng ta tưởng.

LOL, trò đùa là của bạn. Có thế hệ trợ lý AI mới. Tạm biệt Trợ lý Google, Cortana, xin chào ChatGPT, Bard, Copilot. Buzz, buzz, buzz từ đó vang lên. Nếu vòng đầu tiên không thành công, hãy thử lại cho đến khi người dùng chịu thua. Vì vậy, bây giờ, chúng ta có những thứ AI mới ở khắp mọi nơi, giống nhau nhưng khác nhau. Liệu thử nghiệm mới này với AI "hoàn toàn tự nhiên" có thành công không? Không thể. Các hóa thân hiện đại, bất kể chúng được gọi là gì, có thể tạo ra những hình ảnh đáng yêu, viết văn bản như dân chuyên nghiệp và làm những điều kỳ diệu kỳ diệu, nhưng cuối cùng, chúng vẫn yêu cầu đầu vào chính xác để trở nên hữu ích và dữ liệu hữu ích phải chính xác. Và với việc con người là hình ảnh thu nhỏ của sự ngẫu nhiên và tự nghịch lý, không có sức mạnh tính toán nào có thể giải quyết được điều đó. Nhưng chúng ta sẽ thấy. Bạn nghĩ tôi đã quên những điều mới mẻ này phải không? Hãy cẩn thận.

Chúc mừng.