-
词向量与联系人评估数据集-dionisistotsila
词向量与联系人评估数据集-dionisistotsila 数据来源:互联网公开数据 标签:自然语言处理,联系人管理,数据集,词向量,文本分析,机器学习,关系提取,信息检索 数据概述: 该数据集包含用于评估词向量在联系人信息处理中的应用的数据,侧重于联系人之间的关系分析和信息提取。主要特征如下: 时间跨度:... -
企业财报文本分析数据集CorporateFinancialReportTextAnalysis-utkuumur
企业财报文本分析数据集CorporateFinancialReportTextAnalysis-utkuumur 数据来源:互联网公开数据 标签:企业财报, 文本分析, 自然语言处理, SEC, 10-K, 文本挖掘, 财务指标, 商业分析 数据概述:... -
大型语言模型人工智能公开数据组合数据集LLMAIPublicDataCombinedDataset-droidbaza
大型语言模型人工智能公开数据组合数据集LLMAIPublicDataCombinedDataset-droidbaza 数据来源:互联网公开数据 标签:大型语言模型,人工智能,数据集,自然语言处理,机器学习,文本分析,数据整合,开源数据 数据概述:... -
网络仇恨言论数据集HateSpeechDatasets-kylewang1999
网络仇恨言论数据集HateSpeechDatasets-kylewang1999 数据来源:互联网公开数据 标签:仇恨言论,数据集,自然语言处理,社交媒体,文本分析,机器学习,情感分析,网络安全 数据概述: 该数据集包含来自多个社交媒体平台和网络论坛的仇恨言论数据,记录了用户发布包含仇恨、歧视或攻击性内容的文本信息。主要特征如下:... -
Jigsaw原创数据集JigsawOriginalDataDataset-gonnbe
Jigsaw原创数据集JigsawOriginalDataDataset-gonnbe 数据来源:互联网公开数据 标签:数据集,自然语言处理,文本分析,机器学习,情感分析,文本分类,人工智能,研究资源 数据概述: 该数据集包含来自Jigsaw平台提供的原创数据,记录了互联网上的文本内容及相关标签信息。主要特征如下:... -
安然公司电子邮件数据集20-样本-adriancampos
安然公司电子邮件数据集20-样本-adriancampos 数据来源:互联网公开数据 标签:电子邮件,数据集,安然公司,文本分析,自然语言处理,信息检索,欺诈检测,公司治理 数据概述: 该数据集包含来自安然公司(Enron)员工的电子邮件数据,是原始数据集的20%样本。主要特征如下: 时间跨度:数据记录的时间范围主要集中在2000年至2002年之间。... -
越南诗歌数据集VietnamesePoemDataset-hoang1808
越南诗歌数据集VietnamesePoemDataset-hoang1808 数据来源:互联网公开数据 标签:诗歌,越南,文学,数据集,自然语言处理,文本分析,情感分析,文化研究 数据概述: 该数据集包含越南诗歌作品,记录了大量越南诗歌的文本内容。主要特征如下: 时间跨度:数据涵盖了不同历史时期的越南诗歌作品,具体时间跨度取决于数据来源。... -
arXiv论文摘要数据集extracted-abstract-736-lunanana1999
arXiv论文摘要数据集extracted-abstract-736-lunanana1999 数据来源:互联网公开数据 标签:arXiv论文,摘要,自然语言处理,文本分析,机器学习,学术研究,文本挖掘,科研 数据概述: 该数据集包含来自arXiv预印本服务器的论文摘要,旨在为自然语言处理和文本分析研究提供数据支持。主要特征如下: 时间跨度:... -
偏见评分数据集PartialityScoresDataset-omaressam02
偏见评分数据集PartialityScoresDataset-omaressam02 数据来源:互联网公开数据 标签:偏见研究,数据集,社会科学,机器学习,文本分析,伦理研究,情感分析,自然语言处理 数据概述: 该数据集包含来自公开研究项目的偏见评分数据,记录了不同文本内容中的偏见程度。主要特征如下:... -
手写字符图像MNIST数据集HandwrittenCharacterImageMNISTDataset-mukuldesai
手写字符图像MNIST数据集HandwrittenCharacterImageMNISTDataset-mukuldesai 数据来源:互联网公开数据 标签:图像识别, 字符识别, MNIST, 机器学习, 计算机视觉, 数据集, 文本分析, 数据标注 数据概述: 该数据集包含来自MNIST数据库的手写字符图像数据,记录了0-9的数字字符和A-... -
客户服务通话情感分析数据集CustomerServiceCallSentimentAnalysis-rohannkumar141414
客户服务通话情感分析数据集CustomerServiceCallSentimentAnalysis-rohannkumar141414 数据来源:互联网公开数据 标签:情感分析, 客户服务, 通话记录, 情绪识别, 文本分析, 数据挖掘, 客户体验, 机器学习 数据概述:... -
互联网电影数据库IMDB噪声数据研究数据集-amitlakhi
互联网电影数据库IMDB噪声数据研究数据集-amitlakhi 数据来源:互联网公开数据 标签:电影,数据集,文本分析,自然语言处理,情感分析,机器学习,噪声数据,IMDB 数据概述: 该数据集包含来自互联网电影数据库(IMDB)的电影评论数据,其中包含噪声数据,用于研究噪声对文本分析的影响。主要特征如下:... -
YouTube视频趋势分析数据集YouTubeVideoTrendingAnalysis-ibrahimkaratas
YouTube视频趋势分析数据集YouTubeVideoTrendingAnalysis-ibrahimkaratas 数据来源:互联网公开数据 标签:YouTube, 视频, 趋势分析, 社交媒体, 视频推荐, 数据挖掘, 文本分析, 流行文化 数据概述:... -
社交媒体用户行为分析推文数据集SocialMediaUserBehaviorAnalysisTweets-akashkoka
社交媒体用户行为分析推文数据集SocialMediaUserBehaviorAnalysisTweets-akashkoka 数据来源:互联网公开数据 标签:社交媒体, 用户行为分析, 文本分析, 情感分析, 机器学习, 推文, 社交网络, 数据挖掘 数据概述:... -
成吉思汗维基百科传记文本数据集GenghisKhanWikipediaBiographyTextDataset-mehmeteminaydin
成吉思汗维基百科传记文本数据集GenghisKhanWikipediaBiographyTextDataset-mehmeteminaydin 数据来源:互联网公开数据 标签:历史人物, 维基百科, 传记文本, 自然语言处理, 文本分析, 蒙古帝国, 历史研究, 数据清洗 数据概述:... -
政治新闻文本分类数据集PoliticalNewsTextClassificationDataset-indhirasivasakthij
政治新闻文本分类数据集PoliticalNewsTextClassificationDataset-indhirasivasakthij 数据来源:互联网公开数据 标签:新闻文本, 政治, 分类, 文本分析, 自然语言处理, 机器学习, 舆情分析, 数据标注 数据概述:... -
英语阅读理解考试数据集EnglishReadingComprehensionExamDataset-romikgosai
英语阅读理解考试数据集EnglishReadingComprehensionExamDataset-romikgosai 数据来源:互联网公开数据 标签:阅读理解, 英语学习, 文本分析, 自然语言处理, 机器阅读理解, 考试评估, 教育, 数据集 数据概述: 该数据集包含来自考试资源的数据,记录了英语阅读理解试题及相关信息。主要特征如下:... -
法律文书分类与分析数据集BKAi2024-ictworld
法律文书分类与分析数据集BKAi2024-ictworld 数据来源:互联网公开数据 标签:法律,文书,分类,自然语言处理,文本分析,机器学习,法律人工智能,数据集 数据概述: 该数据集包含来自不同来源的法律文书,旨在用于法律文书的分类与分析。主要特征如下: 时间跨度:数据记录的时间范围不限,涵盖了不同时期的法律文书。... -
歌曲歌词文本分析数据集SongLyricsTextAnalysisDataset-aayushsin7a
歌曲歌词文本分析数据集SongLyricsTextAnalysisDataset-aayushsin7a 数据来源:互联网公开数据 标签:歌词, 音乐, 文本分析, 自然语言处理, ABBA, 情感分析, 文本挖掘, 数据集 数据概述: 该数据集包含来自互联网的歌曲歌词文本数据,记录了歌曲的艺术家、歌曲名称、歌曲链接和歌词文本。主要特征如下:... -
文本分词与语料库处理数据集Tokenize-CorpusDataset-dinhnhattruong
文本分词与语料库处理数据集Tokenize-CorpusDataset-dinhnhattruong 数据来源:互联网公开数据 标签:自然语言处理,文本分词,数据集,语料库,机器学习,文本分析,数据挖掘,人工智能 数据概述: 该数据集专注于文本分词与语料库处理,记录了多种语言的文本数据及相应的分词结果。主要特征如下:...