找到11,966个数据集

标签: 自然语言处理

过滤结果
  • 皮埃罗格数据集-英语短文本主题相关性评估数据集

    2025年4月14日   

    皮埃罗格数据集-英语短文本主题相关性评估数据集 数据来源:互联网公开数据 标签:文本,主题,相关性,评测,机器学习,教育,英语,自然语言处理,ChatGPT,GPT-4 数据概述: 皮埃罗格数据集是一个小型、开放许可的、机器生成的数据集,包含十五篇短篇英语文本,涵盖五个主题,并附带相关性判断(qrels),专为教育目的设计。...
    packageimg
  • 五大人气卡通角色谷歌搜索结果数据集-2023

    2025年4月14日   

    五大人气卡通角色谷歌搜索结果数据集-2023 数据来源:互联网公开数据 标签:谷歌搜索,卡通,数据分析,人气趋势,文本分析,自然语言处理,在线内容,娱乐研究 数据概述: 本数据集提供了5个广受欢迎的卡通角色——秦时宝(Shin-chan)、多啦A梦(Doraemon)、Ben 10、讨厌的亨利(Horrid Henry)和憨豆先生(Mr....
    packageimg
  • Twitter金融话题文本数据印度Nifty502017-2022

    2025年4月14日   

    Twitter金融话题文本数据印度Nifty502017-2022 数据来源:互联网公开数据 数据来源: 本数据集收集自社交媒体平台,包含带有话题标签 nifty50 的推文,时间范围从 2017年9月 至 2022年9月,适用于金融情绪分析、股市舆情研究和自然语言处理模型训练。 数据内容: 该数据集记录了五年内包含 nifty50...
    packageimg
  • 孟加拉语拼写检查数据集

    2025年4月14日   

    孟加拉语拼写检查数据集 数据来源:互联网公开数据 标签:孟加拉语,拼写检查,词表,语言处理,数据词典,研究工具,自然语言处理 数据概述:...
    packageimg
  • HuggingFace平台模型元数据与下载量分析数据集-2021年6月

    2025年4月14日   

    HuggingFace平台模型元数据与下载量分析数据集-2021年6月 数据来源:互联网公开数据 标签:Hugging Face, 模型, 机器学习, 自然语言处理, 计算机视觉, 模型库, 元数据, 下载量, 文本分析 数据概述: 本数据集包含了Hugging Face模型中心(Model...
    packageimg
  • 英语学习者语言熟练度评估多标签分类竞赛数据集

    2025年4月14日   

    英语学习者语言熟练度评估多标签分类竞赛数据集 数据来源:互联网公开数据 标签:多标签分类,英语学习者,语言熟练度评估,教育技术,自然语言处理,机器学习,学业分析 数据概述:...
    packageimg
  • Databricks人工智能对话交互数据集-Dolly项目-开放域对话-15000-样本

    2025年4月14日   

    Databricks人工智能对话交互数据集-Dolly项目-开放域对话-15000-样本 数据来源:互联网公开数据 标签:自然语言处理,对话系统,机器学习,人工智能,文本数据,对话生成,交互,Prompt,响应,Dolly,Databricks,Hugging Face 数据概述:...
    packageimg
  • 斯坦福问答数据集SQuAD泰米尔语翻译数据集-CHAIi竞赛

    2025年4月14日   

    斯坦福问答数据集SQuAD泰米尔语翻译数据集-CHAIi竞赛 数据来源:互联网公开数据 标签:问答,泰米尔语,翻译,自然语言处理,机器阅读理解,CHAIi,文本数据,数据集 数据概述: 本数据集是通过将斯坦福问答数据集(SQuAD,Stanford Question Answering...
    packageimg
  • 代码生成模型DeclamaC代码还原性能评估数据集

    2025年4月14日   

    代码生成模型DeclamaC代码还原性能评估数据集 数据来源:互联网公开数据 标签:代码生成, C代码, 反编译, 机器学习, 模型评估, 深度学习, CodeLlama, 自然语言处理 数据概述: 本数据集用于评估Declama模型在C代码还原任务中的性能。Declama模型是基于CodeLlama-7b-hf模型进行微调,专门用于解决从Hex-...
    packageimg
  • 数据80行手写乌尔都语OCR数据集

    2025年4月14日   

    数据80行手写乌尔都语OCR数据集 数据来源:互联网公开数据 标签:手写识别,乌尔都语,OCR,光学字符识别,自然语言处理,文档数字化,历史文献 数据概述:...
    packageimg
  • 德国仇恨言论语料库

    2025年4月14日   

    德国仇恨言论语料库 数据来源:互联网公开数据 标签:仇恨言论,德语,社交网络,文本标注,自然语言处理,内容识别,社会媒体分析 数据概述:...
    packageimg
  • 随机日期数据集

    2025年4月14日   

    随机日期数据集 数据来源:互联网公开数据 标签:日期识别,机器学习,自然语言处理,数据标注,文本分析,日期标注,日期提取 数据概述: 本数据集包含由Python脚本生成的随机日期数据,旨在用于机器学习模型训练,以识别文档中的日期。数据集标注了每个词或词组是否为日期,为日期标注任务提供了基础。 数据用途概述:...
    packageimg
  • 亚马逊评论情感分析数据集

    2025年4月14日   

    亚马逊评论情感分析数据集 数据来源:互联网公开数据 标签:亚马逊,评论分析,情感分析,自然语言处理,电商评测,消费者行为,产品评价 数据概述:...
    packageimg
  • 情感分析文本情感分类数据集

    2025年4月14日   

    情感分析文本情感分类数据集 数据来源:互联网公开数据 标签:情感分析,文本分类,自然语言处理,机器学习,情感识别,文本数据 数据概述: 本数据集是一个用于情感分析的文本情感分类数据集。 数据集包含文本内容及其对应的情感标签,用于训练和评估情感分析模型。...
    packageimg
  • 金融欺诈与非欺诈相关的新闻分类数据集

    2025年4月14日   

    金融欺诈与非欺诈相关的新闻分类数据集 数据来源:互联网公开数据 标签:金融欺诈,非欺诈,新闻分类,自然语言处理,金融科技,数据标注 数据概述 本数据集旨在帮助用户对新闻文章进行分类,区分金融欺诈相关和非欺诈相关的内容。由于现有公开数据集中缺乏满足该需求的资源,本数据集由研究团队从头构建,旨在为类似研究提供支持。 数据集包含以下两个CSV文件: 1....
    packageimg
  • 作者身份识别推文数据集

    2025年4月14日   

    作者身份识别推文数据集 数据来源:互联网公开数据 标签:文本数据,推文,作者身份,作者归属,自然语言处理,机器学习,文本分类,社交媒体分析 数据概述: 本数据集包含了推文内容及其对应的作者姓名,旨在为构建作者身份识别模型提供基准数据集。 数据集包含不同作者发布的推文文本,可用于训练模型来识别推文的作者。 数据用途概述:...
    packageimg
  • 电影相关推文数据集

    2025年4月14日   

    电影相关推文数据集 数据来源:互联网公开数据 标签:电影,社交媒体,推文,情感分析,文本处理,大数据,自然语言处理 数据概述:...
    packageimg
  • IMDB电影评论有用性预测数据集

    2025年4月14日   

    IMDB电影评论有用性预测数据集 数据来源:互联网公开数据 标签:电影评论,情感分析,自然语言处理,机器学习,有用性预测,用户行为,文本挖掘,IMDB 数据概述:...
    packageimg
  • 印度刑法典条款信息数据集

    2025年4月14日   

    印度刑法典条款信息数据集 数据来源:互联网公开数据 标签:印度刑法典,IPC,法律条款,犯罪行为,法律分析,法律趋势,自然语言处理,情感分析,法律咨询 数据概述:...
    packageimg
  • 通用数据集描述模板-2019数据集

    2025年4月14日   

    通用数据集描述模板-2019数据集 数据来源:互联网公开数据 标签:社交媒体,情感分析,用户行为,自然语言处理,2019年,数据科学 数据概述: haha-2019数据集包含了2019年内社交媒体平台上用户发布的各类内容记录。数据集涵盖了文本内容、发布时间、用户信息等关键要素,为研究社交媒体上的用户行为、情感分析及内容传播提供了丰富的数据支持。...
    packageimg