-
知识图谱实体文本数据集KnowledgeGraphEntityTextDataset-chiritacatalinaelena
知识图谱实体文本数据集KnowledgeGraphEntityTextDataset-chiritacatalinaelena 数据来源:互联网公开数据 标签:知识图谱, 实体识别, 文本摘要, 自然语言处理, 数据清洗, 文本分析, 数据库, 信息检索 数据概述:... -
土耳其诗歌文本数据集TurkishPoemsTextDataset-kaanefekeles
土耳其诗歌文本数据集TurkishPoemsTextDataset-kaanefekeles 数据来源:互联网公开数据 标签:诗歌, 土耳其语, 文本分析, 诗歌创作, 情感分析, 文本挖掘, 自然语言处理, 文化研究 数据概述: 该数据集包含来自土耳其的诗歌文本,记录了不同诗人的作品。主要特征如下:... -
关键词提取算法YAKE数据集关键词提取算法YAKEDataset-lunanana1999
关键词提取算法YAKE数据集关键词提取算法YAKEDataset-lunanana1999 数据来源:互联网公开数据 标签:关键词提取,自然语言处理,文本挖掘,数据集,机器学习,信息检索,文本分析,学术研究 数据概述: 该数据集包含用于训练和评估YAKE(Yet Another Keyword... -
写作风格与生成文本检测数据集WritingStyle-GeneratedTextDetectionDataset-shijirbatbaatar
写作风格与生成文本检测数据集WritingStyle-GeneratedTextDetectionDataset-shijirbatbaatar 数据来源:互联网公开数据 标签:文本分析, 写作风格, 机器生成文本, 文本分类, 自然语言处理, 论文写作, 语言模型, 数据集 数据概述:... -
韩国留学论文翻译数据集TranslatedEssaysKODataset-umgeeyo
韩国留学论文翻译数据集TranslatedEssaysKODataset-umgeeyo 数据来源:互联网公开数据 标签:论文翻译,韩国留学,数据集,机器翻译,自然语言处理,语言学,文本分析,韩语 数据概述: 该数据集包含韩国留学申请相关的论文翻译数据,旨在促进机器翻译和语言学习研究。主要特征如下:... -
Reddit恐怖故事数据集SpookyRedditStoriesDataset-justjoshtings
Reddit恐怖故事数据集SpookyRedditStoriesDataset-justjoshtings 数据来源:互联网公开数据 标签:恐怖故事,数据集,文本分析,情感分析,自然语言处理,社交媒体,机器学习,内容创作 数据概述: 该数据集包含来自Reddit平台上的恐怖故事数据,记录了用户发布的各类恐怖故事内容。主要特征如下:... -
加州大学圣迭戈分校UCSDReddit子版块数据集-luketaylor12345
加州大学圣迭戈分校UCSDReddit子版块数据集-luketaylor12345 数据来源:互联网公开数据 标签:社交媒体,Reddit,数据集,文本分析,自然语言处理,情感分析,社区研究,机器学习 数据概述: 该数据集包含了来自加州大学圣迭戈分校(UCSD)相关的 Reddit 子版块的数据,记录了用户在 Reddit... -
越南新闻数据集VietNews数据集-trananhcuong
越南新闻数据集VietNews数据集-trananhcuong 数据来源:互联网公开数据 标签:越南新闻, 数据集, 自然语言处理, 机器学习, 文本分析, 新闻学, 文本挖掘, 社会研究... -
说服性论文数据集PersuadeEssayDataset-gendoso
说服性论文数据集PersuadeEssayDataset-gendoso 数据来源:互联网公开数据 标签:论文,数据集,自然语言处理,文本分析,写作质量,情感分析,机器学习,教育 数据概述: 该数据集包含来自 Kaggle 的说服性论文数据,记录了学生撰写的说服性文章,旨在评估学生的写作能力及说服技巧。主要特征如下:... -
新闻报纸普里特里卡数据集NewspaperPotrikaDataset-miratunnahar
新闻报纸普里特里卡数据集NewspaperPotrikaDataset-miratunnahar 数据来源:互联网公开数据 标签:新闻,数据集,文本分析,社会研究,机器学习,自然语言处理,学术资源,历史研究 数据概述:该数据集包含来自普里特里卡(Potrika)报纸的数据,记录了该报纸从1870年到2018年期间的历史文章。主要特征如下:... -
亚马逊商品元数据数据集AmazonMeta-DataDataset-dartigb
亚马逊商品元数据数据集AmazonMeta-DataDataset-dartigb 数据来源:互联网公开数据 标签:电商,商品,元数据,文本分析,推荐系统,自然语言处理,机器学习,数据挖掘 数据概述: 该数据集包含来自亚马逊电商平台的商品元数据,记录了大量商品的详细信息。主要特征如下:... -
酒店用户评论情感分析数据集HotelUserReviewsSentimentAnalysisDataset-daniabizara
酒店用户评论情感分析数据集HotelUserReviewsSentimentAnalysisDataset-daniabizara 数据来源:互联网公开数据 标签:情感分析, 用户评论, 酒店评价, 自然语言处理, 文本分析, VADER, 情绪分析, 推荐系统 数据概述:... -
印度人民党推特数据集BJPIncTweetsDataDataset-saibalpatra
印度人民党推特数据集BJPIncTweetsDataDataset-saibalpatra 数据来源:互联网公开数据 标签:社交媒体,政治分析,数据集,推特,印度人民党,文本分析,情感分析,机器学习 数据概述: 该数据集包含来自印度人民党(BJP Inc)的推特数据,记录了该党派在推特平台上的推文内容。主要特征如下:... -
文本挖掘人工智能数据集CleanedDatasetforTextMiningforAI-stefaniaconte
文本挖掘人工智能数据集CleanedDatasetforTextMiningforAI-stefaniaconte 数据来源:互联网公开数据 标签:文本挖掘,数据集,人工智能,自然语言处理,机器学习,文本分析,数据清洗,信息检索 数据概述:该数据集包含经过清理和预处理的文本数据,适用于文本挖掘和人工智能领域的研究和应用。主要特征如下:... -
CommonLit2023开放式文本阅读理解数据集-lftuwujie
CommonLit2023开放式文本阅读理解数据集-lftuwujie 数据来源:互联网公开数据 标签:阅读理解,文本分析,自然语言处理,教育,数据集,机器学习,文本挖掘,语言学 数据概述: 该数据集由CommonLit平台提供,包含了来自不同年级学生的开放式文本阅读理解数据,旨在促进对阅读理解和文本分析的研究。主要特征如下:... -
多语言翻译语料库MultilingualTranslationCorpus-pushpaksaraf
多语言翻译语料库MultilingualTranslationCorpus-pushpaksaraf 数据来源:互联网公开数据 标签:机器翻译, 语言学, 语料库, 自然语言处理, 文本翻译, 文本分析, 印度语, 语言对 数据概述:... -
学术论文自然语言处理文章数据集NLPArticlesfromarXiv-org1994-2020Dataset-sagyndykbn
学术论文自然语言处理文章数据集NLPArticlesfromarXiv-org1994-2020Dataset-sagyndykbn 数据来源:互联网公开数据 标签:自然语言处理,学术论文,数据集,文本分析,机器学习,学术研究,计算机科学,文本挖掘 数据概述:... -
教育项目申请审批数据集EducationProjectApplicationApprovalDataset-karthicktj
教育项目申请审批数据集EducationProjectApplicationApprovalDataset-karthicktj 数据来源:互联网公开数据 标签:教育, 项目申请, 审批, 机器学习, 自然语言处理, 文本分析, 教师, 资金申请 数据概述:... -
文本安全风险评估数据集TextSafetyRiskAssessmentDataset-utiric
文本安全风险评估数据集TextSafetyRiskAssessmentDataset-utiric 数据来源:互联网公开数据 标签:文本分析, 风险评估, 情感分析, 恶意文本, 内容审核, 自然语言处理, 机器学习, 数据标注 数据概述: 该数据集包含来自开放平台的文本内容,记录了文本的安全性评估结果。主要特征如下:... -
PSPV5C嵌入向量数据集PSPV5CEmbeddingsDataset-shinomoriaoshi
PSPV5C嵌入向量数据集PSPV5CEmbeddingsDataset-shinomoriaoshi 数据来源:互联网公开数据 标签:嵌入向量,数据集,自然语言处理,机器学习,文本分析,深度学习,语言模型,语义理解 数据概述:该数据集包含来自PSPV5C模型的嵌入向量数据,记录了大量文本数据的语义表示。主要特征如下:...