Bạn cho rằng, trào lưu #10yearschallenge là một meme vô hại? Nhưng sau khi đọc bài viết này, có thể bạn sẽ muốn suy nghĩ lại.
Nếu bạn sử dụng mạng xã hội, chắc hẳn gần đây có để ý đến một trào lưu ngập tràn Facebook, Instagram, và Twitter của người dùng post ảnh của họ ngày ấy-bây giờ, chủ yếu là từ 10 năm trước và năm nay.
Tác giả bài báo đặt giả thuyết các dữ liệu ảnh này có thể đã bị khai thác để huấn luyện thuật toán nhận diện khuôn mặt trong việc xác định mức độ già hóa và nhận diện tuổi tác. Những người phản đối giả thuyết này cho rằng những bức ảnh đằng nào cũng có trên mạng xã hội trước trào lưu này, các dữ liệu này đã có sẵn, và Facebook đằng nào cũng đã có trong tay tất cả các ảnh đại diện người dùng.
Đương nhiên là vậy, nhưng nhìn theo hướng này thử xem.
Tưởng tượng rằng bạn muốn huấn luyện một thuật toán nhận diện khuôn mặt về các đặc điểm liên quan đến tuổi tác, mà cụ thể hơn, là đặc điểm của sự già hóa (ví dụ, người ta trông ra sao khi họ già đi), bạn sẽ cần một dataset thật lớn và chặt chẽ với rất nhiều các hình ảnh của người khác.
Nếu bạn có trong tay thông tin về thời điểm chụp hai bức ảnh ở một con số cố định – ví dụ, 10 năm đi, thì mọi chuyện sẽ dễ dàng hơn rất nhiều. Hiển nhiên là, bạn có thể khai phá dữ liệu trên Facebook và thu tập ảnh đại diện rồi xem ngày đăng ảnh hay dữ liệu EXIF (Exchangeable Image File Format – dữ liệu thông tin về thời gian chụp, các thiết lập của máy ảnh và có thể là các thông tin về bản quyền của bức ảnh đó). Nhưng tất cả những ảnh đại diện đó vẫn có thể gây ra nhất nhiều thông tin nhiễu.
Điều này là bởi người ta thường không upload ảnh theo trình tự thời gian, và việc người ta để ảnh đại diện là hình chó mèo và nhân vật hoạt hình chứ không phải ảnh bản thân không phải là chuyện hiếm. Hơn nữa, các bức ảnh thường không được đăng tải trùng với ngày nó được chụp. Thông qua trào lưu mới trên Facebook, rất nhiều người đã vô tình cung cấp thêm bối cảnh (“tôi năm 2008 và tôi năm 2018”) cũng như là rất nhiều các thông tin khác, trong một số trường hợp người ta ghi cả nơi ảnh được chụp và được chụp như thế nào. (“2008 tại University of Whatever, chụp bởi Joe; 2018 đi thăm New City cho sự kiện gì gì đó năm nay).
Nói cách khác, nhờ và trào lưu này, ai đó đã có trong tay một dataset rất lớn những bức ảnh của mọi người trong khoảng 10 năm trước và hiện tại, tất cả các bức ảnh này đều đã được giám tuyển vô cùng cẩn thận.
Về phần mình, Facebook phủ nhận nhúng tay vào trào lưu #10YearsChallenge. “Đây là một cái meme do người dùng tự tạo và tự trở nên viral”, người phát ngôn của Facebook cho biết. Nhưng ngay cả khi trào lưu này không phải là một sản phẩm của kỹ thuật tấn công social engineering, vài năm gần đây chúng ta đã chứng kiến rất nhiều những ví dụ về các games tương tác và memes được thiết kế ra để khai thác và thu thập dữ liệu người dùng. Social engineering là hành vi đánh lừa người dùng của hệ thống, nhằm phá vỡ hệ thống an ninh, lấy cắp dữ liệu hoặc tống tiền. Nói một cách khác, một trò lừa đảo rất tinh vi trên Internet.
Nếu ai đó lấy ảnh Facebook của bạn ra để huấn luyện thuật toán nhận dạng khuôn mặt thì có phải là xấu không? Cũng không hẳn, theo một cách nào đó, chuyện này là không thể tránh khỏi. Tuy vậy, điều cần quan tâm hơn ở đây chính là cách chúng ta cần nhìn nhận các tương tác của mình với công nghệ, cẩn trọng hơn với những dữ liệu mà mìnhtạo ra, và cách mà chúng có thể bị sử dụng trên nhiều phương diện.
No comments:
Post a Comment