Với tư cách là Giám đốc điều hành của một tổ chức phi lợi nhuận tập trung vào việc thúc đẩy sự đổi mới có trách nhiệm trên thị trường tài chính, AI đã nằm trong tầm ngắm của tôi từ khá lâu. Dưới đây là những điều tôi rút ra và cân nhắc ở cấp độ cao về tương lai của dữ liệu qua lăng kính AI.
Giá trị ngày càng tăng của dữ liệu cho AI
Làm cách nào chúng ta có thể dự báo tầm quan trọng ngày càng tăng của dữ liệu trong một thế giới do AI điều khiển trong tương lai? Chỉ cần nhìn vào cuộc chiến về dữ liệu vì nó liên quan đến một ngành sử dụng nhiều dữ liệu khác: dịch vụ tài chính. Trong thập kỷ qua, các vụ kiện gay gắt đã được đệ trình giữa các sàn giao dịch chứng khoán và các nhà môi giới về các cấp độ và tốc độ dữ liệu khác nhau cho các hệ thống giao dịch. Người tiêu dùng đã được hưởng lợi từ việc tự động hóa thị trường ngày càng tăng, mang lại giao dịch gần như miễn phí và tiết kiệm thêm 30% suốt đời nhờ tự động hóa thị trường. Đồng thời, những người tham gia ngành tài chính thúc đẩy hệ thống giao dịch tự do này đang cạnh tranh để có được các bộ dữ liệu ngày càng có giá trị từ việc trao đổi thông tin giao dịch cần thiết để định tuyến các lệnh ở mức giá tốt nhất.
Trong không gian AI, chúng ta có thể thấy một Cơn sốt vàng tương tự để các công ty truy cập dữ liệu chất lượng cao nhất và nhận thấy rằng chi phí của các bộ dữ liệu khác nhau có thể khác nhau giữa các nhà cung cấp. Dữ liệu có thể được thu thập bởi các công ty công nghệ bằng dữ liệu nội bộ—chẳng hạn như hồ sơ tài chính hoặc thông tin khách hàng—hoặc bên ngoài thông qua nhà cung cấp bên thứ ba với dữ liệu để "cho thuê" hoặc đôi khi thông qua cơ sở dữ liệu công cộng miễn phí. Đối với các tổ chức phi lợi nhuận có số lượng thành viên hoặc thông tin lớn, có thể có các cuộc trò chuyện nội bộ về cách kiếm tiền từ dữ liệu để hệ thống AI sử dụng nhằm tối đa hóa hiệu quả của một tổ chức.
Hơn nữa, đối với các công ty bắt đầu xây dựng hệ thống AI, có thể đặt ra câu hỏi liệu các nguồn dữ liệu công cộng miễn phí có đủ dữ liệu chất lượng để xây dựng hệ thống AI mới hay không, hay liệu ngân sách mua dữ liệu của bên thứ ba có nên được xây dựng khi khởi nghiệp hay không. ngân sách, và liệu điều này có thể gây ra bất kỳ rào cản tiềm năng nào cho việc gia nhập của các công ty mới hay không.
Quyền riêng tư dữ liệu và nhận dạng kỹ thuật số
Điều quan trọng nữa là các doanh nghiệp phải minh bạch—và cung cấp cho người tiêu dùng khả năng đồng ý—bất kỳ ý định sử dụng hoặc chia sẻ dữ liệu của người tiêu dùng trong tương lai. Tôi tin rằng ngành nên xem xét các lựa chọn để người tiêu dùng giữ quyền sở hữu hoặc quyền "cổ tức" đối với dữ liệu cá nhân của họ nếu người ta coi dữ liệu là một loại hàng hóa có thể kiếm tiền từ cuối nguồn.
Các câu hỏi về quyền riêng tư dữ liệu và bảo vệ dữ liệu trước đây thường được giải quyết dựa trên sự chắp vá của luật tiểu bang khác nhau ở các khu vực pháp lý khác nhau và một số đã kêu gọi luật liên bang mạnh mẽ hơn.
Trong số các ý tưởng đang được xem xét là liệu người tiêu dùng có nên có nhận dạng kỹ thuật số liên bang hay không (hiện chỉ có ID kỹ thuật số của tiểu bang) có thể hoạt động như một loại giấy phép lái xe để sử dụng dữ liệu, với các ứng dụng tiềm năng để người tiêu dùng kiểm soát tốt hơn dữ liệu của họ trong tương lai khi giá trị của AI tăng lên.
Nhiều người trong chúng tôi đã cung cấp dữ liệu của mình cho các diễn đàn truyền thông xã hội hoặc theo những cách khác và có thể không biết dữ liệu của chúng tôi đang được kiếm tiền như thế nào. Cần xem xét các cách để người tiêu dùng có khả năng đồng ý không chỉ với việc thu thập dữ liệu của họ mà còn đối với việc sử dụng tiếp theo dữ liệu được thu thập. Trong bối cảnh này, nhiều người đã kêu gọi ban hành luật riêng tư bảo vệ dữ liệu liên bang để làm rõ vấn đề này.
Đảm bảo chất lượng dữ liệu, tránh sai lệch thuật toán
Những người đang tìm cách sử dụng bộ dữ liệu cho hệ thống AI có thể hỏi: Chất lượng dữ liệu của chúng tôi là gì? Dữ liệu có khả năng bị sai lệch không? Dữ liệu cần thiết rộng đến mức nào để có một bộ dữ liệu chất lượng và giá là bao nhiêu?
Một hệ thống AI chỉ hoạt động tốt khi dữ liệu được đưa vào đó. Đối với tôi, điều này gợi lên hình ảnh đường ống là hệ thống/công nghệ AI và nước là nguyên liệu thô hoặc dữ liệu đi vào hệ thống. Hiện tại, rất khó để đo lường chất lượng của một tập dữ liệu và một số công ty có thể mua nhiều bộ dữ liệu cho cùng một câu hỏi để xác định những sai lệch hoặc sai sót tiềm ẩn.
Sẽ rất thú vị nếu các doanh nghiệp có cách thực hiện bài kiểm tra "chất lượng nước" cơ bản đối với các tập dữ liệu họ sử dụng cho hệ thống AI — một loại điểm hệ thống xếp hạng tín dụng cho các tập dữ liệu, nếu bạn muốn. Để AI chính xác, một tập dữ liệu cần phải rộng lớn và không có sai lệch có thể góp phần gây ra các vấn đề về sai lệch thuật toán hoặc kết quả không đáng tin cậy.
Đảm bảo cạnh tranh cho các nhà đổi mới nhỏ hơn
Hơn nữa, do chi phí của dữ liệu chất lượng cao, sẽ có khả năng xảy ra một sân chơi không bình đẳng giữa những người có đủ khả năng chi trả cho chất lượng cao hơn hoặc các bộ dữ liệu độc quyền hoặc không công khai mạnh mẽ hơn để đưa vào hệ thống AI của họ và những người không thể.
Điều này đặt ra những câu hỏi thú vị về khả năng tiếp cận dữ liệu, đảm bảo một sân chơi bình đẳng và liệu lợi thế kinh tế nhờ quy mô hay các công ty lớn đang thu thập dữ liệu có thể có lợi thế về tài nguyên dữ liệu so với các đối thủ cạnh tranh trẻ hơn hay không.
Một số học giả, chẳng hạn như Giáo sư Michael Wellman, Đại học Michigan, đã đặt ra câu hỏi liên quan đến quyền truy cập dữ liệu và liệu ai có quyền truy cập thông tin tốt nhất có thể có AI tốt nhất hay không. Điều này cũng dẫn đến cuộc thảo luận về khả năng tập trung quyền sở hữu các khối dữ liệu lớn có thể có chất lượng tốt hơn dữ liệu nguồn mở mang lại giá trị chiến lược cho các công ty.
Mặc dù việc áp dụng AI dường như vẫn đang ở giai đoạn đầu, nhưng nhiều cá nhân vẫn đang khám phá xem công nghệ này có thể tác động như thế nào đến cuộc sống và hoạt động kinh doanh hàng ngày, nhưng điều quan trọng là phải khắc phục những vấn đề có thể phát sinh xung quanh dữ liệu, có tính đến các bài học rút ra từ dữ liệu khác. -Các ngành giàu có như tài chính.
Chúng ta nên hỏi—và tìm kiếm câu trả lời cho—các câu hỏi quan trọng về chính sách dữ liệu, đồng thời trao quyền cho bản thân để xác định rủi ro và cơ hội tham gia vào lĩnh vực AI đang phát triển này, hướng tới sự đổi mới có trách nhiệm và đảm bảo rằng AI là công cụ cho con người.
Casti Hub dịch
Nguồn: Forbes