-
法律文章分析数据集LegalArticlesDataset-saidgrich
法律文章分析数据集LegalArticlesDataset-saidgrich 数据来源:互联网公开数据 标签:法律文章,数据集,文本分析,法学研究,自然语言处理,法律咨询,法律知识,法律教育 数据概述: 该数据集包含来自多个法律网站和法律数据库的法律文章数据,记录了各类法律文件,案例分析和法律评论等详细信息。主要特征如下:... -
Gojek用户评论情感分析数据集GojekUserReviewSentimentAnalysisDataset-ahmdfkhr3
Gojek用户评论情感分析数据集GojekUserReviewSentimentAnalysisDataset-ahmdfkhr3 数据来源:互联网公开数据 标签:情感分析,用户评论,数据集,自然语言处理,机器学习,文本分析,市场研究,客户反馈 数据概述:... -
网络欺凌检测数据集CyberBullyingDetectionDataset-ali12rz
网络欺凌检测数据集CyberBullyingDetectionDataset-ali12rz 数据来源:互联网公开数据 标签:网络欺凌,数据集,文本分析,社交媒体,机器学习,自然语言处理,数据分析,社会研究 数据概述:该数据集包含来自社交媒体平台的文本数据,记录了用户之间的互动,特别是涉及网络欺凌的评论和消息。主要特征如下:... -
维基百科与MSMARCO问答数据集WikiandMSMARCOQ-ADataset-rangoiv
维基百科与MSMARCO问答数据集WikiandMSMARCOQ-ADataset-rangoiv 数据来源:互联网公开数据 标签:自然语言处理,问答系统,数据集,信息检索,机器学习,文本分析,知识图谱,深度学习 数据概述: 该数据集结合了维基百科和MS MARCO的数据,记录了大量的问答对和相关信息检索结果。主要特征如下:... -
IMDB电影评论数据集IMDBMovieReviewsDataset-fernarancibia
IMDB电影评论数据集IMDBMovieReviewsDataset-fernarancibia 数据来源:互联网公开数据 标签:电影,评论,情感分析,自然语言处理,数据集,文本分析,机器学习,影评 数据概述: 该数据集包含来自互联网电影数据库(IMDB)的电影评论数据,记录了用户对电影的评价和评论内容。主要特征如下:... -
巴西歌曲歌词数据集BrazilianSongsLyricsDataset-jorgefjr
巴西歌曲歌词数据集BrazilianSongsLyricsDataset-jorgefjr 数据来源:互联网公开数据 标签:巴西音乐,歌词,数据集,文本分析,自然语言处理,文化研究,音乐研究,诗歌分析 数据概述:该数据集包含来自巴西的歌曲歌词数据,记录了不同年代,风格和语言的巴西歌曲歌词。主要特征如下:... -
电影信息聊天机器人数据集-vantanle71
电影信息聊天机器人数据集-vantanle71 数据来源:互联网公开数据 标签:电影,数据集,聊天机器人,自然语言处理,情感分析,推荐系统,电影评论,文本分析 数据概述: 该数据集包含电影的详细信息,旨在用于构建电影信息聊天机器人。主要特征如下: 时间跨度: 数据涵盖了从电影上映至今的电影数据。 地理范围: 数据主要来源于全球范围内的电影信息。... -
法律领域命名实体识别数据集-pratikpujarichef
法律领域命名实体识别数据集-pratikpujarichef 数据来源:互联网公开数据 标签:命名实体识别,法律,自然语言处理,文本分析,数据集,机器学习,司法,合同 数据概述: 该数据集包含从法律文本中提取的命名实体数据,旨在用于法律领域的命名实体识别(NER)任务。主要特征如下: 时间跨度:数据覆盖的时间范围不限,主要取决于收集到的法律文本的时间。... -
消费者情感分析电商数据集SentimentAnalysisE-commerceDataset-rabbyshajinislam
消费者情感分析电商数据集SentimentAnalysisE-commerceDataset-rabbyshajinislam 数据来源:互联网公开数据 标签:情感分析,电商,数据集,自然语言处理,机器学习,消费者行为,文本分析,商业智能 数据概述: 该数据集包含来自电商平台的消费者评论数据,记录了用户对商品的情感倾向和评价。主要特征如下:... -
垃圾短信检测数据集SMSSpamDataset-hanzvivatma
垃圾短信检测数据集SMSSpamDataset-hanzvivatma 数据来源:互联网公开数据 标签:文本分类,垃圾短信,自然语言处理,机器学习,数据集,短信,NLP,文本分析 数据概述: 该数据集包含了大量短信文本数据,用于垃圾短信的检测与识别。主要特征如下: 时间跨度: 数据记录的时间范围不明确,但涵盖了短信内容在一定时间内的收集。 地理范围:... -
命名实体识别零样本与少样本学习数据集NERCSZero-ShotandFew-ShotDataset-abdullahahmedabooof
命名实体识别零样本与少样本学习数据集NERCSZero-ShotandFew-ShotDataset-abdullahahmedabooof 数据来源:互联网公开数据 标签:命名实体识别,零样本学习,少样本学习,数据集,自然语言处理,机器学习,文本分析,人工智能 数据概述:... -
哲学文本作者与风格分析数据集-christopherlemke
哲学文本作者与风格分析数据集-christopherlemke 数据来源:互联网公开数据 标签:哲学,文本分析,NLP,写作风格,作者,哲学史 数据概述: 本数据集收录了多位哲学家的文本作品,涵盖不同时期和流派。每个文件包含一个或多个由同一位作者撰写的哲学文本。数据集旨在为研究哲学文本的结构、作者的写作风格及不同时期的特点提供基础。 数据用途概述:... -
语义文本相关性数据集SemanticTextualRelatednessData-udvasbasak
语义文本相关性数据集SemanticTextualRelatednessData-udvasbasak 数据来源:互联网公开数据 标签:文本分析,语义理解,自然语言处理,机器学习,信息检索,人工智能,语言模型,数据挖掘 数据概述: 该数据集包含来自公开资源的数据,记录了用于衡量文本间语义相关性的文本对。主要特征如下:... -
数字马拉雅拉姆语言数据集DigitalMalayalamLanguageDataset-amaljossy
数字马拉雅拉姆语言数据集DigitalMalayalamLanguageDataset-amaljossy 数据来源:互联网公开数据 标签:数字语言,马拉雅拉姆,数据集,自然语言处理,文本分析,机器学习,语言学,人工智能 数据概述: 该数据集包含来自互联网和公开资源的马拉雅拉姆语言文本数据,记录了各种类型的马拉雅拉姆文本。主要特征如下:... -
土耳其网络数据集TurkishWebDatasettg-2024-1-denizhanahin
土耳其网络数据集TurkishWebDatasettg-2024-1-denizhanahin 数据来源:互联网公开数据 标签:网络数据,土耳其,数据集,文本分析,机器学习,自然语言处理,社交媒体,数据挖掘 数据概述: 该数据集包含来自土耳其互联网公开数据的信息,记录了土耳其网络环境下的各类文本数据。主要特征如下:... -
情绪识别数据集6-EmotionData-rahulshelke98
情绪识别数据集6-EmotionData-rahulshelke98 数据来源:互联网公开数据 标签:情绪识别,数据集,机器学习,自然语言处理,情感分析,心理学,文本分析,人工智能 数据概述:该数据集包含来自多个来源的情绪识别数据,记录了不同文本的情绪标签。主要特征如下: 时间跨度:数据记录的时间范围从2015年到2020年。... -
亚马逊德国商品评论数据集AmazonGermanyProductReviewDataset-dsonparote
亚马逊德国商品评论数据集AmazonGermanyProductReviewDataset-dsonparote 数据来源:互联网公开数据 标签:电子商务,商品评论,数据集,消费者行为,文本分析,情感分析,数据挖掘,机器学习 数据概述: 该数据集包含来自亚马逊德国网站的消费者商品评论数据,记录了用户对各类商品的评价和反馈。主要特征如下:... -
命名实体识别数据集-土耳其语-语料库NER数据集-土耳其语-语料库-niubi666
命名实体识别数据集-土耳其语-语料库NER数据集-土耳其语-语料库-niubi666 数据来源:互联网公开数据 标签:命名实体识别,数据集,自然语言处理,机器学习,文本分析,土耳其语,语料库,人工智能 数据概述:该数据集包含土耳其语的命名实体识别数据,记录了土耳其语文本中的关键实体,如人名,组织名,地名等。主要特征如下:... -
双语样本数据集BitextSampleDataset-pragadeeshn01
双语样本数据集BitextSampleDataset-pragadeeshn01 数据来源:互联网公开数据 标签:双语文本,数据集,自然语言处理,机器学习,翻译,语言学,文本分析,人工智能 数据概述: 该数据集包含来自不同来源的双语文本样本数据,主要用于机器翻译,文本对齐和自然语言处理研究。主要特征如下:... -
有毒评论测试数据集-husanrahmatullayev
有毒评论测试数据集-husanrahmatullayev 数据来源:互联网公开数据 标签:文本分析,自然语言处理,数据集,情感分析,有毒内容,机器学习,评论数据,文本分类 数据概述: 该数据集包含用于测试有毒评论检测模型的文本数据,记录了各种类型的在线评论,并标注了其毒性。主要特征如下:...