找到11,961个数据集

标签: 自然语言处理

过滤结果
  • 数据1000对孟加拉语到俄语翻译数据集

    2025年4月14日   

    数据1000对孟加拉语到俄语翻译数据集 数据来源:互联网公开数据 标签:孟加拉语,俄语,翻译,语言学研究,机器翻译,语料库,双语系统,自然语言处理 数据概述:...
    packageimg
  • 罗马乌尔都语仇恨言论检测数据集

    2025年4月14日   

    罗马乌尔都语仇恨言论检测数据集 数据来源:互联网公开数据 标签:罗马乌尔都语,仇恨言论,社交媒体评论,数据融合,文本分析,自然语言处理 数据概述: 本数据集是由三个数据集合并而成,分别是RomanUrduDataSet、HS-RU-20和roman-Urdu-abusive-comment-...
    packageimg
  • 交互式数据分析笔记本自然语言到代码生成数据集

    2025年4月14日   

    交互式数据分析笔记本自然语言到代码生成数据集 数据来源:互联网公开数据 标签:自然语言处理,代码生成,交互式笔记本,机器学习,数据科学 数据概述:...
    packageimg
  • 多语言对话数据集

    2025年4月14日   

    多语言对话数据集 数据来源:互联网公开数据 标签:多语言对话, AI训练, 自然语言处理, 跨语言系统, 会话分析, 聊天机器人, 多语言支持 数据概述: 本数据集是一个用于多语言对话模型训练的资源,包含中文、英文、韩语和日语四种主要语言的对话记录。数据集涵盖了广泛的对话场景,提供了结构化和多样化的会话数据,为开发跨语言对话系统提供了坚实的基础。...
    packageimg
  • PG-4-11数据集19-21

    2025年4月14日   

    PG-4-11数据集19-21 数据来源:互联网公开数据 标签:PG-4-11,编程,代码生成,自然语言处理,开源数据 数据概述:...
    packageimg
  • 十年厨艺竞技节目厨神当街剧集数据集

    2025年4月14日   

    十年厨艺竞技节目厨神当街剧集数据集 数据来源:互联网公开数据 标签:厨艺竞技,节目分析,食材选择,自然语言处理,评委评分,剧集汇总 数据概述:...
    packageimg
  • 问题分类数据集

    2025年4月14日   

    问题分类数据集 数据来源:互联网公开数据 标签:问题分类,问答系统,自然语言处理,文本分类,信息抽取,机器学习,数据标注 数据概述:...
    packageimg
  • 文本分类器数据集

    2025年4月14日   

    文本分类器数据集 数据来源:互联网公开数据 标签:文本分类,语音转录,动作识别,对象识别,位置识别,机器学习,自然语言处理,数据标注 数据概述: 本数据集包含了从音频文件中提取的文本转录内容,记录了描述某一动作或过程的文字信息。数据集旨在提供用于识别动作、对象和位置的文本特征,支持训练相应的机器学习算法。 数据用途概述:...
    packageimg
  • 人工智能辅助检测论文数据集-中小学作文文本-2024

    2025年4月14日   

    人工智能辅助检测论文数据集-中小学作文文本-2024 数据来源:互联网公开数据 标签:人工智能,检测,论文,写作,教育,机器学习,自然语言处理,ChatGPT,学术诚信 数据概述: 本数据集旨在推动关于人工智能(AI)检测写作的研究,特别关注中小学作文。...
    packageimg
  • 韩国大学人文论文数据集

    2025年4月14日   

    韩国大学人文论文数据集 数据来源:互联网公开数据 标签:韩国大学,人文论文,教育,学术研究,自然语言处理,文本分析,教育趋势 数据概述:...
    packageimg
  • 僧伽罗语新闻文章数据集

    2025年4月14日   

    僧伽罗语新闻文章数据集 数据来源:互联网公开数据 标签:僧伽罗语,新闻,多分类,文本数据,机器学习,自然语言处理,斯里兰卡新闻,开源数据集 数据概述: 本数据集基于斯里兰卡知名新闻网站Hiru...
    packageimg
  • 推特用户对特定实体的情感分析数据集

    2025年4月14日   

    推特用户对特定实体的情感分析数据集 数据来源:互联网公开数据 标签:情感分析,推特,社交媒体,文本挖掘,自然语言处理,机器学习,情感分类,实体识别 数据概述: 本数据集专注于推特数据的实体级情感分析。对于每条推文(消息)及其在其中提到的特定实体,数据集旨在确定用户对该实体表达的情感。 数据集将情感分为三个类别: 积极:推文表达了对实体的积极看法。...
    packageimg
  • 美国仇恨犯罪分类数据集1963-2021

    2025年4月14日   

    美国仇恨犯罪分类数据集1963-2021 数据来源:互联网公开数据 标签:仇恨犯罪,分类分析,美国,时间序列,自然语言处理,预测建模 数据概述: 本数据集包含3700条来自Google Trend的CSV记录,涵盖了1963年至2021年间美国的仇恨犯罪事件。每条记录包括新闻标题、日期、地点和URL等关键信息,为研究和防范仇恨犯罪提供了宝贵的数据支持。...
    packageimg
  • 图鲁语YouTube视频评论情感分析数据集

    2025年4月14日   

    图鲁语YouTube视频评论情感分析数据集 数据来源:互联网公开数据 标签:图鲁语,YouTube,评论,情感分析,自然语言处理,文本数据,情感分类 数据概述:...
    packageimg
  • Reddit平台热门科技子版块帖子互动数据分析数据集

    2025年4月14日   

    Reddit平台热门科技子版块帖子互动数据分析数据集 数据来源:互联网公开数据 标签:Reddit,科技,社区,社交媒体,帖子,互动,情感分析,自然语言处理 数据概述:...
    packageimg
  • 康德著作数据集

    2025年4月14日   

    康德著作数据集 数据来源:互联网公开数据 标签:康德,哲学,伦理学,道德学,形而上学,自然语言处理,文本分析 数据概述: 本数据集收录了伊曼努尔·康德的主要著作,涵盖了伦理学、道德学和形而上学等领域。数据集包含一个自增列和四个重要的信息列,包括著作标题、出版日期以及原始文本和清理后的文本。这些文本数据为研究康德哲学思想提供了丰富的资源。 数据用途概述:...
    packageimg
  • 网络攻击性言论数据集

    2025年4月14日   

    网络攻击性言论数据集 数据来源:互联网公开数据 标签:仇恨言论,攻击性言论,社交媒体,内容审核,自然语言处理,文本分析,社会问题 数据概述:...
    packageimg
  • arXiv论文摘要与嵌入向量每日更新数据集

    2025年4月14日   

    arXiv论文摘要与嵌入向量每日更新数据集 数据来源:互联网公开数据 标签:arXiv,论文,摘要,嵌入向量,自然语言处理,机器学习,科研,学术,每日更新 数据概述: 本数据集包含每日arXiv论文的标题、摘要以及对应的嵌入向量。数据集每天更新,其中不包含周六、周日及节假日的论文。嵌入向量的计算方法详见提供的Notebook文件。...
    packageimg
  • 德语问答数据集

    2025年4月14日   

    德语问答数据集 数据来源:互联网公开数据 标签:德语问答,自然语言处理,机器学习,问答系统,数据标注,德语分析,跨语言学习 数据概述:...
    packageimg
  • Steam游戏评论关键要素标注数据集-英语评论-2024

    2025年4月14日   

    Steam游戏评论关键要素标注数据集-英语评论-2024 数据来源:互联网公开数据 标签:游戏评论,Steam,用户评价,文本分析,情感分析,自然语言处理,机器学习,数据标注 数据概述:...
    packageimg