Phần 1 trong series “Big Data Trong Việc Phân Tích Và Phát Hiện Tội Phạm” sẽ chia sẻ về giai đoạn chuẩn bị dữ liệu, hướng dẫn sử dụng và các lưu ý.
Big Data là thuật ngữ dùng để chỉ một tập hợp dữ liệu rất lớn và rất phức tạp đến nỗi những công cụ, ứng dụng xử lí dữ liệu truyền thống không thể nào đảm đương được. Tuy nhiên, Big Data lại chứa trong mình rất nhiều thông tin quý giá mà nếu trích xuất thành công, nó sẽ giúp rất nhiều cho việc kinh doanh, nghiên cứu khoa học, dự đoán các dịch bệnh sắp phát sinh và thậm chí là cả việc xác định điều kiện giao thông theo thời gian thực. Chính vì thế, những dữ liệu này phải được thu thập, tổ chức, lưu trữ, tìm kiếm, chia sẻ theo một cách khác so với bình thường.
Phần I: Chuẩn bị dữ liệu, hướng sử dụng và các lưu ý
Trong loạt bài viết này, chúng tôi muốn giới thiệu đến các bạn việc sử dụng Big Data trong phân tích hành vi tội phạm cũng như dự đoán, phát hiện và ngăn chặn tội phạm như thế nào.
Nên nhớ rằng số lượng cảnh sát là có hạn, việc phân bổ giữa cảnh sát tuần tra và cảnh sát thường trực hợp lí là cực kì quan trọng để đảm bảo cả hệ thống hoạt động hiệu quả.
Mỗi cục cảnh sát thường sẽ lưu lại một số lượng rất lớn những báo cáo tội phạm qua từng năm. Việc phân tích các dữ liệu này có thể giúp chúng ta:
- Phòng chống tội phạm: bao gồm việc dự đoán khả năng xảy ra tội ác (địa điểm và thời gian), tỉ lệ xuất hiện một loại tội phạm trong một khoảng thời gian nhất định, các vấn đề có thể phát sinh sau các sự kiện khách quan,…
- Truy bắt tội phạm: sử dụng Big Data để phân tích tâm lí và hành vi tội phạm, tìm hiểu cách thức tội ác được thực hiện, nhận dạng tội phạm, thiết lập các giả thiết về nghi phạm,…
Đây là hai hướng đi chính hiện nay trong việc áp dụng Big Data trong phân tích và phát hiện tội phạm. Điều thú vị là cả hai hướng đi này đều áp dụng một phương thức phân tích khá tương đồng. Mục đích chính của phương thức này là để xây dựng một giải pháp phân tích mà cảnh sát có thể sử dụng để phát hiện những manh mối liên quan giữa các vụ án, thời gian, địa điểm và các manh mối chi tiết, phương thức gồm các bước như sau:
1.Xử lí trước
Dữ liệu thường được xử lí trước tùy thuộc vào mục đích sử dụng. Trong một báo cáo vụ án thường sẽ có những thuộc tính chính như sau:
Dữ liệu sẽ được xử lí trước và chọn lọc lại những thuộc tính cần thiết cho quá trình sử dụng, ví dụ trong việc xác định các khu vực nóng về tỉ lệ phạm tội thì người phân tích thường quan tâm đến các thuộc tính 1,3,4. Để xác định tâm lí tội phạm thì thường quan tâm đến các thuộc tính 1, 2, 3, 5, 7, 8, 9. Để xác định các phương thức tội phạm thường sử dụng thì lại quan tâm hơn đến 1, 2, 3, 4, 5, 9 chẳng hạn.
2. Phân tích + Tinh chỉnh & Nhận biết.
Phòng chống tội phạm: Dự đoán tội phạm gây án ở địa điểm, thời gian, hoàn cảnh nào đó. Sử dụng các thuật toán tìm đường di chuyển chung, các thuật toán phân lớp để xác định điểm nóng phạm tội,…
Truy bắt tội phạm: Xác định cách thức gây án chung, thuật toán suy đoán các thủ thuật tương tự để rút gọn phạm vi nghi phạm, thuật toán định dạng khuôn mặt tội phạm,…
Chúng tôi sẽ nói chi tiết về từng thuật toán nổi bật được sử dụng trong các phần tiếp theo của series.
3. Báo cáo & Đánh giá
Việc báo cáo và đánh giá này chủ yếu nhằm xác định tính chính xác và tin cậy của các mô hình dự đoán cũng như các quyết định được đưa ra trong quá trình truy bắt.
Mức độ tin cậy phần lớn được định nghĩa CHỦ QUAN (ví dụ dự đoán khoảng 60% sẽ xuất hiện tội phạm ở khu vực A vào 18:00 chủ nhật có thể được coi là không đủ tin cậy hoặc đủ tin cậy tùy theo người có thẩm quyền quyết định)
Việc sử dụng các công cụ dự đoán và phân tích dựa trên Big Data hiện đã được áp dụng cho nhiều thành phố ở Mĩ, Anh, Trung Quốc,… và thu được kết quả rất khả quan.
Trong các bài tiếp theo chúng tôi sẽ đi lần lượt vào hai hướng đi chính trong phát hiện tội phạm với Big Data là phòng chống tội phạm và truy bắt tội phạm. Ở mỗi hướng đi này chúng tôi sẽ đưa ra một thuật toán thông dụng nhất, mục đích và điểm mạnh/ điểm yếu của các thuật toán đó. Mời các bạn đón xem.
No comments:
Post a Comment