找到93个数据集

标签: 关键词提取

过滤结果
  • 新皮塔瓦尔刑事案例集1842_1890

    2025年12月22日 30 14 7

    数据集概述 本数据集是《新皮塔瓦尔》(1842-1890)刑事案例集的数字化文本语料库,包含五七百个来自不同国家、不同时期的刑事案例,共六十卷,由数字人文合作项目采用校正OCR技术处理,为相关文学语料库分析研究提供基础数据。 文件详解 该数据集主要包含一个ZIP压缩包文件,具体说明如下: - 文件名称: DerNeuePitaval_v1.2.zip...
    packageimg
  • 构建日志分析数据集LogChunks

    2025年12月11日 30 177 169

    数据集概述 该数据集包含从80个GitHub仓库收集的797条Travis CI构建日志,覆盖29种开发语言。日志按语言和仓库分类存储,部分日志含人工标注的构建失败原因片段,并标注关键词及结构分类,可用于构建日志分析研究。 文件详解 该数据集主要包含一个压缩文件,内部结构如下: - 文件名称: LogChunks.zip - 文件格式: ZIP...
    packageimg
  • 农业教育医学领域自动标引评估资源语料库与黄金标准索引数据集

    2025年12月11日 30 75 63

    数据集概述 该数据集包含农业、教育、医学三个领域的语料库及其对应的黄金标准索引,用于自动标引系统的评估。每个领域语料库含不同规模的文档集合,文档包含标题、摘要等元数据,黄金标准索引来自各领域专业数据库。 文件详解 文件名称:Corpora+Gold_Standard_Index.zip 文件格式:ZIP(.zip) 包含内容:...
    packageimg
  • 催化反应词汇数据集

    2025年12月4日 30 37 15

    数据集概述 该数据集围绕催化反应领域的专业词汇构建,核心内容为一个压缩格式的词汇文件,未提供进一步的描述信息。 文件详解 文件名称: vocabulary.zip 文件格式: ZIP压缩包 文件内容: 压缩包内包含催化反应领域的词汇数据,具体内容需解压后查看。 适用场景 化学工程研究: 可用于催化反应领域的术语标准化或专业词典构建。 自然语言处理:...
    packageimg
  • 科研试剂与实验设备文本信息数据集

    2025年11月17日 30 23 18

    科研试剂与实验设备文本信息数据集_Research_Reagents_and_Equipment_Text_Information 数据来源:互联网公开数据 标签:科研试剂, 实验设备, 文本分析, 关键词提取, 品牌识别, 行业研究, 文本分类, 数据挖掘 数据概述:...
    packageimg
  • 医学文献摘要PubMed分析数据集

    2025年10月24日 30 12 6

    医学文献摘要PubMed分析数据集_Medical_Literature_Abstract_PubMed_Analysis 数据来源:互联网公开数据 标签:医学, 生物医学, PubMed, 摘要分析, 文本挖掘, 关键词提取, 临床研究, 自然语言处理 数据概述:...
    packageimg
  • 新冠疫情文献摘要分析数据集

    2025年10月23日 30 196 124

    新冠疫情文献摘要分析数据集_COVID_19_Literature_Abstract_Analysis 数据来源:互联网公开数据 标签:新冠疫情, 文本分析, 生物医学, 疫情研究, 文献摘要, 关键词提取, 疾病传播, 机器学习 数据概述:...
    packageimg
  • 商品描述文本分析数据集

    2025年10月21日 30 129 0

    商品描述文本分析数据集_Product_Description_Text_Analysis 数据来源:互联网公开数据 标签:商品描述, 文本分析, 商品分类, 文本挖掘, 自然语言处理, 市场营销, 电商数据, 关键词提取 数据概述:...
    packageimg
  • 科研论文摘要关键词提取数据集

    2025年10月3日 30 179 65

    科研论文摘要关键词提取数据集_Scientific_Paper_Abstract_Keyword_Extraction 数据来源:互联网公开数据 标签:科研论文, 摘要, 关键词提取, 自然语言处理, 文本分析, 机器学习, 文本挖掘, 数据标注 数据概述: 该数据集包含来自科研论文摘要的数据,记录了论文的摘要内容及对应的关键词。主要特征如下:...
    packageimg
  • COVID_19_研究论文摘要分析数据集

    2025年8月7日 30 104 69

    COVID_19_研究论文摘要分析数据集_COVID_19_Research_Paper_Abstract_Analysis 数据来源:互联网公开数据 标签:COVID-19, 医学, 论文分析, 文本挖掘, 摘要, 关键词提取, 自然语言处理, 机器学习 数据概述:...
    packageimg
  • 俄语新闻文本关键词提取数据集

    2025年7月27日 30 174 64

    俄语新闻文本关键词提取数据集_Russian_News_Text_Keyword_Extraction_Dataset 数据来源:互联网公开数据 标签:文本分析, 关键词提取, 自然语言处理, 俄语, 新闻, 文本挖掘, 语料库, 信息检索 数据概述: 该数据集包含来自俄罗斯新闻网站的文章文本数据,主要用于关键词提取和文本分析任务。主要特征如下:...
    packageimg
  • Reddit论坛用户评论与回复关系数据集-2007-2014

    2025年6月1日 30 74 0

    Reddit论坛用户评论与回复关系数据集-2007-2014 数据来源:互联网公开数据 标签:Reddit, 论坛, 评论, 回复, 社交媒体, 自然语言处理, 文本分析, 关键词提取 数据概述: 本数据集包含从 2007 年至 2014 年间,Reddit 论坛上随机抽取的 400...
    packageimg
  • 药物-研究-疗法与病毒文本匹配数据集TextMatchingDatasetforDrugs-Studies-Therapies-andViruses-benjpjones

    2025年5月30日 30 203 102

    药物-研究-疗法与病毒文本匹配数据集TextMatchingDatasetforDrugs-Studies-Therapies-andViruses-benjpjones 数据来源:互联网公开数据 标签:文本匹配, 生物医学, 药物发现, 研究分析, 病毒学, 疗法研究, 自然语言处理, 关键词提取 数据概述:...
    packageimg
  • 商品描述关键词分析数据集ProductDescriptionKeywordAnalysis-yogesh174

    2025年5月30日 30 111 54

    商品描述关键词分析数据集ProductDescriptionKeywordAnalysis-yogesh174 数据来源:互联网公开数据 标签:商品描述, 关键词提取, 文本分析, 商品分类, 机器学习, 零售, 自然语言处理, 文本挖掘 数据概述:...
    packageimg
  • 社交媒体用户个性化描述关键词提取数据集SocialMediaUserBioKeywordExtractionDataset-sagu123

    2025年5月30日 30 209 131

    社交媒体用户个性化描述关键词提取数据集SocialMediaUserBioKeywordExtractionDataset-sagu123 数据来源:互联网公开数据 标签:社交媒体, 文本分析, 关键词提取, 自然语言处理, 情感分析, 机器学习, Tinder, 数据标注 数据概述:...
    packageimg
  • 土耳其新闻文本分类数据集TurkishNewsTextClassificationDataset-erythropygia

    2025年5月30日 30 203 57

    土耳其新闻文本分类数据集TurkishNewsTextClassificationDataset-erythropygia 数据来源:互联网公开数据 标签:新闻文本, 文本分类, 自然语言处理, 土耳其语, 舆情分析, 关键词提取, 政治新闻, 深度学习 数据概述:...
    packageimg
  • 新闻文章内容分析数据集NewsArticleContentAnalysisDataset-vinishuchiha

    2025年5月29日 30 55 22

    新闻文章内容分析数据集NewsArticleContentAnalysisDataset-vinishuchiha 数据来源:互联网公开数据 标签:新闻文章, 文本分析, 内容摘要, 自然语言处理, 新闻媒体, 事件分类, 关键词提取, 舆情分析 数据概述: 该数据集包含来自Manorama...
    packageimg
  • 教育写作评估主题分析数据集EducationalWritingAssessmentTopicAnalysis-pitinghau

    2025年5月29日 30 33 27

    教育写作评估主题分析数据集EducationalWritingAssessmentTopicAnalysis-pitinghau 数据来源:互联网公开数据 标签:写作评估, 文本分析, 教育, 论文分析, 语义分析, 关键词提取, 自然语言处理, 机器学习 数据概述:...
    packageimg
  • 新闻摘要文本分析数据集NewsSummaryTextAnalysis-terrychanorg

    2025年5月28日 30 132 29

    新闻摘要文本分析数据集NewsSummaryTextAnalysis-terrychanorg 数据来源:互联网公开数据 标签:新闻摘要, 文本分析, 自然语言处理, 文本摘要, 关键词提取, 语义分析, 机器翻译, 数据标注 数据概述:...
    packageimg
  • 关键词提取算法YAKE数据集关键词提取算法YAKEDataset-lunanana1999

    2025年5月28日 30 110 86

    关键词提取算法YAKE数据集关键词提取算法YAKEDataset-lunanana1999 数据来源:互联网公开数据 标签:关键词提取,自然语言处理,文本挖掘,数据集,机器学习,信息检索,文本分析,学术研究 数据概述: 该数据集包含用于训练和评估YAKE(Yet Another Keyword...
    packageimg