-
语言文字文本对比研究数据集LanguageTextComparisonCorpus-ayushmuley
语言文字文本对比研究数据集LanguageTextComparisonCorpus-ayushmuley 数据来源:互联网公开数据 标签:语言学, 文本分析, 文本对比, 语料库, 罗马字母, 梵文, 文本挖掘, 机器学习 数据概述: 该数据集包含来自语言学研究领域的数据,记录了罗马字母转写梵文的文本。主要特征如下:... -
文本自动纠错数据集CleanedAutoCorrectDataset-oyounis
文本自动纠错数据集CleanedAutoCorrectDataset-oyounis 数据来源:互联网公开数据 标签:文本纠错,数据集,自然语言处理,机器学习,文本分析,文本处理,语言技术,人工智能 数据概述:该数据集包含经过清洗和自动纠错处理的文本数据,适用于文本纠错和自然语言处理任务。主要特征如下:... -
国际货币基金组织IMF文档文本信息提取数据集InternationalMonetaryFundDocumentTextExtraction-davisja...
国际货币基金组织IMF文档文本信息提取数据集InternationalMonetaryFundDocumentTextExtraction-davisjacobthomas 数据来源:互联网公开数据 标签:文本提取, PDF解析, 文本分析, 财务报告, 国际金融, 结构化数据, 文本标注, 机器学习 数据概述:... -
大型语言模型系统预处理数据集LMSYSPreprocessedDataset-a5hvin
大型语言模型系统预处理数据集LMSYSPreprocessedDataset-a5hvin 数据来源:互联网公开数据 标签:自然语言处理,数据集,机器学习,深度学习,语言模型,数据预处理,文本分析,人工智能 数据概述:... -
数据2021年最新新闻数据集LatestNewsDataset2021-newsdataio
2021年最新新闻数据集LatestNewsDataset2021-newsdataio 数据来源:互联网公开数据 标签:新闻,数据集,文本分析,自然语言处理,机器学习,情感分析,信息检索,数据挖掘 数据概述:该数据集包含来自2021年全球各地的新闻数据,记录了各类新闻事件和报道内容。主要特征如下:... -
翻译质量评估数据集QuACE数据集-emam2002
翻译质量评估数据集QuACE数据集-emam2002 数据来源:互联网公开数据 标签:机器翻译,数据集,翻译质量评估,自然语言处理,文本分析,语言学,深度学习,文本相似度 数据概述: 该数据集包含来自 QuACE(Quality Assessment of Computer-Enhanced... -
土耳其大国民议会命名实体识别数据集TBMMNERDataset-esrapolat
土耳其大国民议会命名实体识别数据集TBMMNERDataset-esrapolat 数据来源:互联网公开数据 标签:自然语言处理,命名实体识别,土耳其语,数据集,文本分析,政治,机器学习,NLP 数据概述: 该数据集包含来自土耳其大国民议会(TBMM)的文本数据,用于命名实体识别(NER)任务。主要特征如下:... -
数据2011-2019年主题话题数据集2011-2019年主题话题数据集-marcosneco
2011-2019年主题话题数据集2011-2019年主题话题数据集-marcosneco 数据来源:互联网公开数据 标签:主题分析,社交媒体,数据集,文本分析,自然语言处理,社会研究,情感分析,市场趋势 数据概述:该数据集包含来自社交媒体平台的2011年至2019年期间的主题话题数据,记录了不同时间段内热门话题和讨论内容。主要特征如下:... -
计算重用-词句银行数据集RecomputeUsingWord-SentBankDataset-minhhieu002
计算重用-词句银行数据集RecomputeUsingWord-SentBankDataset-minhhieu002 数据来源:互联网公开数据 标签:自然语言处理,数据集,文本分析,机器学习,语言模型,计算重用,语义理解,人工智能 数据概述: 该数据集包含来自词句银行(Word-Sent... -
电影类型多标签分类数据集MovieGenreMulti-labelClassificationDataset-stormy420
电影类型多标签分类数据集MovieGenreMulti-labelClassificationDataset-stormy420 数据来源:互联网公开数据 标签:电影分类, 多标签, 文本分析, 机器学习, 电影推荐, 数据标注, 深度学习, 图像识别 数据概述:... -
DAGI扩展非论文数据集DAGIExtendedNon-EssayDataset-bulivington
DAGI扩展非论文数据集DAGIExtendedNon-EssayDataset-bulivington 数据来源:互联网公开数据 标签:数据集,文本分析,机器学习,自然语言处理,数据挖掘,文本分类,非结构化数据,学术资源 数据概述: 该数据集包含来自DAGI项目的扩展数据,记录了非论文类文本的详细信息。主要特征如下:... -
文本摘要语料库预处理数据集TextSummarizationCorpusPreprocessed-anandheeanand
文本摘要语料库预处理数据集TextSummarizationCorpusPreprocessed-anandheeanand 数据来源:互联网公开数据 标签:文本摘要, 自然语言处理, 语料库, 预处理, 文本分析, 词嵌入, 机器学习, 文本挖掘 数据概述: 该数据集包含经过预处理的文本数据,旨在为文本摘要任务提供训练素材。主要特征如下:... -
大型语言模型新筛选数据集LLMNewFilteredDataset-ashkankhademian
大型语言模型新筛选数据集LLMNewFilteredDataset-ashkankhademian 数据来源:互联网公开数据 标签:人工智能,自然语言处理,数据集,机器学习,语言模型,文本分析,深度学习,模型训练 数据概述: 该数据集包含经过筛选的大型语言模型(LLM)训练数据,记录了用于优化和训练语言模型的文本内容。主要特征如下:... -
叙利亚冲突新闻摘要分析数据集SyriaConflictNewsSummaryAnalysis-ipaini
叙利亚冲突新闻摘要分析数据集SyriaConflictNewsSummaryAnalysis-ipaini 数据来源:互联网公开数据 标签:新闻摘要, 文本分析, 叙利亚冲突, 自然语言处理, 政治评论, 事件分析, 机器学习, 舆情分析 数据概述: 该数据集包含来自新闻报道的叙利亚冲突相关文章,记录了文章主体内容及其摘要。主要特征如下:... -
虚假新闻文本分析数据集FakeNewsTextAnalysisDataset-shwe1308
虚假新闻文本分析数据集FakeNewsTextAnalysisDataset-shwe1308 数据来源:互联网公开数据 标签:虚假新闻, 文本分析, 新闻分类, 自然语言处理, 情感分析, 机器学习, 舆情分析, 数据清洗 数据概述:... -
医学影像报告诊断数据集MIDRCRICORD-600-lunar123
医学影像报告诊断数据集MIDRCRICORD-600-lunar123 数据来源:互联网公开数据 标签:医学影像,放射学,自然语言处理,数据集,文本分析,疾病诊断,临床研究,人工智能 数据概述: 该数据集来自医学影像数据资源中心(MIDRC),是RICORD-600项目的公开数据集,包含医学影像报告及其对应的诊断结果。主要特征如下:... -
新闻摘要文本分析数据集NewsSummaryTextAnalysis-terrychanorg
新闻摘要文本分析数据集NewsSummaryTextAnalysis-terrychanorg 数据来源:互联网公开数据 标签:新闻摘要, 文本分析, 自然语言处理, 文本摘要, 关键词提取, 语义分析, 机器翻译, 数据标注 数据概述:... -
写作质量特征工程数据集-mcpenguin
写作质量特征工程数据集-mcpenguin 数据来源:互联网公开数据 标签:写作质量,特征工程,自然语言处理,数据集,文本分析,机器学习,语言模型,内容评估 数据概述: 该数据集包含了经过特征工程处理的文本数据,旨在用于评估和预测文本的写作质量。主要特征如下: 时间跨度: 数据集未明确标注时间跨度,但数据来源于不同时间段的文本内容。 地理范围:... -
加拿大联邦议员提案数据集CotaParlamentarFullDataset-mayconbatestin
加拿大联邦议员提案数据集CotaParlamentarFullDataset-mayconbatestin 数据来源:互联网公开数据 标签:政治分析,立法提案,数据集,公共管理,文本分析,机器学习,加拿大政治,政府透明 数据概述: 该数据集包含来自加拿大联邦议会的议员提案数据,记录了议员提交的各类提案和议案的详细信息。主要特征如下:... -
NIT项目-自然语言处理数据集NITProject-NaturalLanguageProcessingDataset-peculiarview
NIT项目-自然语言处理数据集NITProject-NaturalLanguageProcessingDataset-peculiarview 数据来源:互联网公开数据 标签:自然语言处理,NLP,数据集,文本分析,机器翻译,情感分析,信息抽取,文本分类 数据概述: 该数据集由NIT项目提供,包含了多种自然语言处理任务的文本数据。主要特征如下:...