Nghiên cứu cho thấy tính độc hại trong cộng đồng mã nguồn mở khác với các diễn đàn internet khác

 

Thật không may, những kẻ lừa đảo, những kẻ thù ghét, những kẻ châm lửa và những nhân vật xấu xí khác lại là một sự thật của cuộc sống trên hầu hết các mạng internet. Sự xấu xí của họ làm hỏng các mạng xã hội và các trang web như Reddit và Wikipedia.

Nhưng nội dung độc hại trông khác nhau tùy thuộc vào địa điểm và xác định độc tính trực tuyến là bước đầu tiên để loại bỏ nó.

Một nhóm các nhà nghiên cứu từ Viện Nghiên cứu Phần mềm (ISR) thuộc Khoa Khoa học Máy tính của Đại học Carnegie Mellon gần đây đã hợp tác với các đồng nghiệp tại Đại học Wesleyan để thực hiện bước đầu tiên trong việc tìm hiểu tính độc hại trên các nền tảng mã nguồn mở như GitHub.

Tiến sĩ Courtney Miller cho biết: “Bạn phải biết độc tính đó trông như thế nào để thiết kế các công cụ xử lý nó. sinh viên trong ISR và tác giả chính của bài báo. “Và việc xử lý độc tính đó có thể dẫn đến những nơi lành mạnh hơn, toàn diện hơn, đa dạng hơn và tốt hơn nói chung.”

Để hiểu rõ hơn về độc tính trong cộng đồng mã nguồn mở, nhóm nghiên cứu trước tiên đã thu thập nội dung độc hại. Họ đã sử dụng một công cụ phát hiện độc tính và lịch sự được phát triển cho một nền tảng khác để quét gần 28 triệu bài đăng trên GitHub được thực hiện từ tháng 3 đến tháng 5 năm 2020. Nhóm cũng tìm kiếm những bài đăng này để tìm “quy tắc ứng xử”—Một cụm từ thường được sử dụng khi phản ứng với nội dung độc hại — và tìm kiếm các vấn đề bị khóa hoặc bị xóa, cũng có thể là dấu hiệu của độc tính.

Thông qua quá trình kiểm duyệt này, nhóm đã phát triển một tập dữ liệu cuối cùng về 100 bài đăng độc hại. Sau đó, họ sử dụng dữ liệu này để nghiên cứu bản chất của độc tính. Nó có xúc phạm, có quyền, kiêu ngạo, trolling hay không chuyên nghiệp không? Nó có hướng vào chính mã, vào con người hay một nơi nào khác hoàn toàn không?

Miller nói: “Độc tính khác nhau trong các cộng đồng mã nguồn mở. “Nó phù hợp với ngữ cảnh hơn, có quyền, tinh tế và bị động-hung hăng.”

Chỉ có khoảng một nửa số bài đăng độc hại mà nhóm xác định có chứa nội dung tục tĩu. Những người khác đến từ những người sử dụng phần mềm yêu cầu cao. Một số đến từ những người dùng đăng rất nhiều vấn đề trên GitHub nhưng lại đóng góp rất ít. Nhận xét bắt đầu về mã của phần mềm trở nên cá nhân. Không có bài viết nào giúp làm cho phần mềm mã nguồn mở hoặc cộng đồng tốt hơn.

“Ứng dụng tồi tệ nhất. Chưa từng có. Hãy làm cho nó không phải là ứng dụng tồi tệ nhất từ ​​trước đến nay. Cảm ơn”, một người dùng đã viết trong một bài đăng có trong tập dữ liệu.

Nhóm nghiên cứu nhận thấy một xu hướng độc đáo trong cách mọi người phản ứng với độc tính trên các nền tảng mã nguồn mở. Thông thường, nhà phát triển dự án đã cố gắng tiếp cận người dùng hoặc khắc phục các vấn đề được nêu trong nội dung độc hại. Điều này thường xuyên dẫn đến thất vọng.

Miller nói: “Họ muốn đưa ra lợi ích của sự nghi ngờ và tạo ra một giải pháp. “Nhưng điều này hóa ra là đánh thuế.”

Miller nói, phản ứng đối với bài báo rất mạnh mẽ và tích cực. Các nhà phát triển mã nguồn mở và các thành viên cộng đồng rất vui mừng vì nghiên cứu này đang diễn ra và hành vi mà họ đã đối phó trong một thời gian dài cuối cùng đã được công nhận.

“Chúng tôi đã nhận được phản hồi từ các nhà phát triển và thành viên cộng đồng Miller nói trong một thời gian dài về sự độc hại đáng tiếc và gần như ăn sâu vào nguồn mở. Chúng thường có sự đa dạng và lưu giữ khủng khiếp, và điều quan trọng là chúng ta phải bắt đầu giải quyết và đối phó với sự độc hại ở đó để biến nó thành một nơi hòa nhập hơn và tốt hơn. ”

Miller hy vọng nghiên cứu tạo ra nền tảng cho nhiều công việc ngày càng tốt hơn trong lĩnh vực này. Nhóm của cô ấy đã dừng lại trong việc xây dựng một độc tính máy dò cho mã nguồn mở cộng đồng, nhưng nền tảng đã được đặt.

Miller nói: “Có rất nhiều việc phải làm trong không gian này. “Tôi thực sự hy vọng mọi người nhìn thấy điều này, mở rộng nó và giữ cho trái bóng lăn.”

 

 

Trả lời

Email của bạn sẽ không được hiển thị công khai. Các trường bắt buộc được đánh dấu *

Vui lòng bật JavaScript!
Nếu không bật trang không thể hoạt động bình thường![ ? ]