找到5,744个数据集

标签: 文本分析

过滤结果
  • 美国国家科学基金会NSF生物学奖项摘要数据集-picoplankton

    2025年4月26日   

    美国国家科学基金会NSF生物学奖项摘要数据集-picoplankton 数据来源:互联网公开数据 标签:生物学,NSF,奖项,摘要,科研资助,学术研究,文本分析,自然语言处理 数据概述: 该数据集包含了来自美国国家科学基金会(NSF)的生物学领域奖项的摘要信息,记录了NSF资助的生物学研究项目的详细描述。主要特征如下: 时间跨度:...
    packageimg
  • 英语语言文本数据集LanguageDataDataset-danruan

    2025年4月26日   

    英语语言文本数据集LanguageDataDataset-danruan 数据来源:互联网公开数据 标签:自然语言处理,文本分析,数据集,语言学,机器学习,文本挖掘,英语,语料库 数据概述: 该数据集包含来自多种来源的英语文本数据,记录了不同类型的英语文本内容。主要特征如下:...
    packageimg
  • 社交媒体推文数据集TwitterDataPost-rockeryoutube

    2025年4月26日   

    社交媒体推文数据集TwitterDataPost-rockeryoutube 数据来源:互联网公开数据 标签:社交媒体,推文,数据集,文本分析,自然语言处理,社会研究,网络分析,情感分析 数据概述: 该数据集包含来自Twitter的推文数据,记录了用户在特定时间段内的推文内容及相关信息。主要特征如下:...
    packageimg
  • 印度Reddit社区r-India帖子与评论数据集-prakharrastogi534

    2025年4月26日   

    印度Reddit社区r-India帖子与评论数据集-prakharrastogi534 数据来源:互联网公开数据 标签:社交媒体,Reddit,印度,文本分析,情感分析,自然语言处理,社区互动,数据挖掘 数据概述: 该数据集包含来自Reddit社区r/India的帖子和评论数据,记录了用户在该社区中的讨论和互动。主要特征如下:...
    packageimg
  • 泰米尔经典千句诗数据集ThirukkuralCSVDataset-lalithkishorel

    2025年4月26日   

    泰米尔经典千句诗数据集ThirukkuralCSVDataset-lalithkishorel 数据来源:互联网公开数据 标签:泰米尔语,古典文学,数据集,文化研究,文本分析,机器学习,语言研究,诗歌分析 数据概述: 该数据集包含来自泰米尔经典《千句诗》(Thirukkural)的文本数据,记录了这部古代诗歌集的完整内容。主要特征如下:...
    packageimg
  • 推特虚假信息分类数据集Twitter虚假信息分类数据集-hakim11

    2025年4月26日   

    推特虚假信息分类数据集Twitter虚假信息分类数据集-hakim11 数据来源:互联网公开数据 标签:推特,虚假信息,数据集,文本分析,机器学习,自然语言处理,社交媒体,信息验证 数据概述:该数据集包含来自推特的假新闻和真实新闻的推文数据,主要用于虚假信息的分类和识别。主要特征如下: 时间跨度:数据记录的时间范围从2016年到2021年。...
    packageimg
  • Zindi地点提及识别挑战数据集-tanhtr

    2025年4月26日   

    Zindi地点提及识别挑战数据集-tanhtr 数据来源:互联网公开数据 标签:自然语言处理,地点识别,机器学习,文本分析,地理信息,命名实体识别,数据集,非洲 数据概述: 该数据集来自 Zindi 平台举办的地点提及识别挑战赛,旨在识别文本中提到的地点。主要特征如下: 时间跨度:数据的时间跨度取决于文本内容,但主要关注近期的新闻报道和社交媒体信息。...
    packageimg
  • Reddit帖子数据集RedditPostDataset-senpinaki222

    2025年4月26日   

    Reddit帖子数据集RedditPostDataset-senpinaki222 数据来源:互联网公开数据 标签:Reddit,数据集,社交媒体,用户行为,文本分析,自然语言处理,社会研究,大数据 数据概述:该数据集包含来自Reddit的帖子数据,记录了用户在Reddit上发布的帖子详细信息。主要特征如下:...
    packageimg
  • 英文翻译矛盾数据集EnglishTranslationContradictionDataset-sadiq18

    2025年4月26日   

    英文翻译矛盾数据集EnglishTranslationContradictionDataset-sadiq18 数据来源:互联网公开数据 标签:翻译,机器翻译,数据集,自然语言处理,文本分析,矛盾检测,语言学,英语 数据概述: 该数据集包含了英语文本及其对应的翻译,旨在研究翻译中的矛盾和不一致性。主要特征如下:...
    packageimg
  • 谣言识别数据集HoaxTurnbackhoaxDataset-aginanjar

    2025年4月26日   

    谣言识别数据集HoaxTurnbackhoaxDataset-aginanjar 数据来源:互联网公开数据 标签:谣言检测,数据集,文本分析,自然语言处理,信息验证,社交媒体,机器学习,真伪辨别 数据概述: 该数据集来源于“Turnbackhoax”网站,主要记录了关于谣言信息的详细数据,用于谣言的识别与分析。主要特征如下: 时间跨度:...
    packageimg
  • 俄罗斯电影评论大数据集BrFRD1BigRussianFilmReviewDataset1-dmitrykartashov

    2025年4月26日   

    俄罗斯电影评论大数据集BrFRD1BigRussianFilmReviewDataset1-dmitrykartashov 数据来源:互联网公开数据 标签:电影评论,数据集,自然语言处理,文本分析,电影评价,文化研究,社会学,评论分析 数据概述:...
    packageimg
  • 文化遗产文本情感分析数据集-raghadsaeed

    2025年4月26日   

    文化遗产文本情感分析数据集-raghadsaeed 数据来源:互联网公开数据 标签:文化遗产,文本分析,情感分析,自然语言处理,机器学习,文化研究,语料库,情感标注 数据概述:该数据集包含来自互联网的文化遗产相关文本,主要用于情感分析研究。主要特征如下: 时间跨度:数据记录的时间范围不固定,涵盖了不同时期和不同来源的文化遗产相关文本。...
    packageimg
  • 新闻数据集Well-ShuffledNewsDataset-nushrathussain

    2025年4月26日   

    新闻数据集Well-ShuffledNewsDataset-nushrathussain 数据来源:互联网公开数据 标签:新闻,数据集,自然语言处理,文本分析,机器学习,信息检索,数据分析,社会科学研究 数据概述: 该数据集包含来自多个来源的新闻文章,记录了不同类型和主题的新闻内容。主要特征如下: 时间跨度:数据记录的时间范围从2010年到2022年。...
    packageimg
  • UNIR学习图书数据集BooksDatasetforUNIR-wolverinemtb

    2025年4月26日   

    UNIR学习图书数据集BooksDatasetforUNIR-wolverinemtb 数据来源:互联网公开数据 标签:图书,教育,数据集,学术资源,学习,文本分析,自然语言处理,知识图谱 数据概述: 该数据集包含了UNIR(西班牙国际大学)学习资源相关的图书信息。主要特征如下: 时间跨度:数据记录的时间跨度涵盖了UNIR教学使用的图书,时间范围不定。...
    packageimg
  • HuggingFace预训练模型数据集BERT-xenxiou

    2025年4月26日   

    HuggingFace预训练模型数据集BERT-xenxiou 数据来源:互联网公开数据 标签:自然语言处理,数据集,预训练模型,BERT,文本分析,机器学习,语言模型,Transformer 数据概述: 该数据集包含了Hugging Face平台提供的用于预训练BERT模型的数据集。主要特征如下:...
    packageimg
  • 孟加拉语书籍词形还原数据集BanglaBookLemmatizedCSV-nirajmahi

    2025年4月26日   

    孟加拉语书籍词形还原数据集BanglaBookLemmatizedCSV-nirajmahi 数据来源:互联网公开数据 标签:孟加拉语,词形还原,数据集,自然语言处理,文本分析,机器学习,语言学,学术资源 数据概述:该数据集包含来自孟加拉语书籍的词形还原数据,记录了孟加拉语文本中单词的词形还原结果。主要特征如下:...
    packageimg
  • 学生写作能力评估数据集DatasetStudentWriting2-renokan

    2025年4月26日   

    学生写作能力评估数据集DatasetStudentWriting2-renokan 数据来源:互联网公开数据 标签:教育,写作能力,数据集,评估,机器学习,文本分析,自然语言处理,学生表现 数据概述:该数据集包含来自学生写作能力评估项目的数据,记录了学生在写作任务中的表现和评估结果。主要特征如下: 时间跨度:数据记录的时间范围从2018年到2020年。...
    packageimg
  • 书籍嵌入数据集EmbeddingBookData-jojoyin

    2025年4月26日   

    书籍嵌入数据集EmbeddingBookData-jojoyin 数据来源:互联网公开数据 标签:书籍,嵌入,自然语言处理,文本分析,机器学习,推荐系统,语义相似度,数据集 数据概述: 该数据集包含书籍的嵌入表示,旨在捕捉书籍在语义空间中的关系。主要特征如下: 时间跨度:数据记录无明确时间范围,主要基于书籍内容构建嵌入。...
    packageimg
  • 词嵌入训练数据集-akalyasubramanian

    2025年4月26日   

    词嵌入训练数据集-akalyasubramanian 数据来源:互联网公开数据 标签:自然语言处理,词嵌入,数据集,文本分析,机器学习,语义分析,文本挖掘,语言模型 数据概述: 该数据集包含用于训练词嵌入模型的大量文本数据,主要用于学习词语的语义表示。主要特征如下: 时间跨度: 数据记录的时间范围不限,涵盖了不同历史时期的文本数据。 地理范围:...
    packageimg
  • 土耳其2020年5月推特账户数据集TwitterTürkiyeMayıs20207340HesaplarDataseti-okayakca

    2025年4月26日   

    土耳其2020年5月推特账户数据集TwitterTürkiyeMayıs20207340HesaplarDataseti-okayakca 数据来源:互联网公开数据 标签:推特,社交媒体,数据集,用户分析,文本分析,机器学习,自然语言处理,社会学 数据概述:...
    packageimg