Reddit เป็นเว็บไซต์ฟอรัม/โซเชียลมีเดีย ซึ่งเป็นที่รู้จักในฐานะหน้าแรกของอินเทอร์เน็ต ซึ่งผู้ใช้สามารถโพสต์ได้แทบทุกอย่าง ต่างจาก Facebook, Twitter หรือ Instagram ผู้ใช้ Reddit ส่วนใหญ่ยังคงไม่ระบุชื่อ ผู้กลั่นกรอง Reddit เซ็นเซอร์และดูแลฟอรัมย่อยอย่างเข้มงวดหรือที่เรียกว่า subreddits อย่างไรก็ตาม การไม่เปิดเผยตัวตนทำให้ผู้คนสามารถพูดในสิ่งที่พวกเขาต้องการได้ไม่ว่าจะด้วยวิธีใดก็ตาม ดังนั้นความคิดเห็นและโพสต์ของ Reddit จึงเหมาะสำหรับการทดสอบและฝึกอบรมโมเดลการประมวลผลภาษาธรรมชาติ (NLP) จำนวนมาก โมเดลเหล่านี้บางส่วนรวมถึงโมเดลการควบคุมเนื้อหาและตัวแยกประเภทความรู้สึก
คำเตือน: ชุดข้อมูลบางส่วนด้านล่างได้รับการรวบรวมโดยเฉพาะสำหรับการฝึกโมเดลการควบคุมเนื้อหา ดังนั้น ข้อมูลอาจมีเนื้อหาที่โจ่งแจ้ง
-
Cryptocurrency Reddit Comments Dataset – ชุดข้อมูลนี้มีความคิดเห็นจาก subreddit r/cryptocurrency ข้อมูลประกอบด้วยความคิดเห็นที่โพสต์ในช่วงห้าเดือนตั้งแต่เดือนพฤศจิกายน 2017 ถึงมีนาคม 2018
-
ความคิดเห็นของ Donald Trump บน Reddit – ชุดข้อมูลง่ายๆ ที่มีความคิดเห็นนับพันที่รวบรวมจาก Reddit ที่กล่าวถึง Donald Trump
-
การคาดคะเนคะแนนความคิดเห็นของ Reddit – ชุดข้อมูลนี้สร้างขึ้นเพื่อช่วยสร้างแบบจำลองที่สามารถคาดเดาได้ว่าความคิดเห็นของ Reddit จะได้รับการโหวตขึ้นหรือลงหรือไม่ ชุดข้อมูลประกอบด้วยความคิดเห็น Reddit 4 ล้านรายการ: 2 ล้านความคิดเห็นที่มีประสิทธิภาพต่ำ (โหวตไม่ลง) และ 2 ล้านความคิดเห็นที่มีประสิทธิภาพสูง (โหวตขึ้น)
-
ข่าวประจำวันสำหรับการทำนายตลาดหุ้น – ตามชื่อเรื่อง ชุดข้อมูลนี้ถูกสร้างขึ้นเพื่อสร้างแบบจำลองที่สามารถทำนายความผันผวนของตลาดหุ้นได้ ข้อมูลประกอบด้วยข่าวที่รวบรวมข้อมูลจาก r/worldnews ตั้งแต่มิถุนายน 2551 ถึงกรกฎาคม 2559 รวมถึงข้อมูลหุ้นเฉลี่ยอุตสาหกรรมดาวโจนส์
ซื้อเหรียญโคติได้ที่ไหน
-
World News on Reddit – นำมาจาก r/worldnews subreddit ชุดข้อมูลนี้มีข้อมูลเกี่ยวกับข่าวทั้งหมดที่โพสต์ใน subreddit นี้ย้อนหลังไปถึงปี 2008 ชุดข้อมูลประกอบด้วยข้อมูลต่อไปนี้: วันที่สร้าง upvotes และ downvotes ชื่อผู้แต่งและ ไม่ว่าข่าวจะมีเนื้อหาสำหรับผู้ใหญ่หรือไม่
...
#แมชชีนเลิร์นนิง #ดาต้า-วิทยาศาสตร์ #ชุดข้อมูล #แมชชีนเลิร์นนิง #ai
lionbridge.ai
ชุดข้อมูล Reddit 10 อันดับแรกสำหรับการเรียนรู้ของเครื่อง
ด้วยข้อมูลที่นำมาจาก 'หน้าแรกของอินเทอร์เน็ต' คู่มือนี้จะแนะนำชุดข้อมูล Reddit 10 อันดับแรกสำหรับการเรียนรู้ของเครื่อง