-
DAST文本语义复杂度判定数据集
数据集概述 该数据集基于DAST模型构建,用于判定文本的语义复杂度。包含多个测试场景下的实验数据,以压缩文件形式存储,覆盖实验数据、问题表单、眼动追踪数据等内容,为文本语义复杂度分析提供多场景数据支持。 文件详解 数据集按测试场景分类存储,包含以下压缩文件: - 测试场景1相关文件: -...
-
翻译数据集5A_14_西格玛等于1_第十四部分
数据集概述 该数据集包含翻译相关的认证文件,是在西格玛等于一百的维加斯采样参数点上,运行参数拓扑算法并设置西格玛等于一点零后得到的复合输出文件,共七十二个文件,用于支持相关研究分析。 文件详解...
-
BERT与LSTM模型研究数据集
数据集概述 本数据集围绕BERT与LSTM模型研究构建,包含Twitter/X用户帖子数据及GOTO股票市场价格历史数据,数据按年份分类存储,主要以CSV格式为主,为相关模型研究提供数据支持。 文件详解 目录结构: 根目录:BERT and LSTM Research/ 数据目录:BERT and LSTM Research/Data - New...
-
人类撰写文本样本数据集
数据集概述 本数据集是人类撰写的文本样本集合,包含五份文档文件,均为docx格式,未进行训练/测试、数据/标签或原始/处理数据的划分,为自然语言处理(NLP)等相关研究提供基础文本资源。 文件详解 该数据集包含五个docx格式的文档文件,具体说明如下: - 文件名称及格式: - Sample of human-authored...
-
皮肤科临床试验方案撰写的人工智能大语言模型应用补充材料
数据集概述 本数据集是关于“利用人工智能大语言模型撰写皮肤科临床试验方案”的补充材料,包含研究方法与结果相关文档,为原研究提供详细支撑信息。 文件详解 文件名称: JAAD_supplement.docx 文件格式: DOCX(Word文档) 内容说明:...
-
学术英语_商务与医学_评价性That从句模式的AI与语料库研究数据集
数据集概述 本数据集基于AI和语料库方法,研究商务与医学领域学术英语中评价性That从句模式。聚焦评价性语言在学术写作中的应用,揭示其在构建学术论证、传达作者立场方面的作用,为学术英语语言学研究提供支持。 文件详解 文件名称: 2that sent.xlsx 文件格式: Excel (.xlsx) 内容说明:...
-
打字健康_短信管理特应性皮炎潜力数据集
数据集概述 该数据集是论文《Typing Health: The Potential of Text Messaging to Manage Atopic Dermatitis》的补充材料,聚焦短信在特应性皮炎管理中的应用潜力,为相关研究提供辅助信息支持。 文件详解 文件名称: Typing health the potential of text...
-
临床试验描述抽取式摘要数据集
数据集概述 该数据集包含临床试验描述抽取式摘要研究相关的语料库、评估结果及代码。核心内容为过滤后的临床试验数据、生成摘要的ROUGE评分、人工评估数据与结果,以及用于语料生成的代码脚本,为临床试验文本摘要研究提供支持。 文件详解 文件名称: data_and_code.zip 文件格式: ZIP 包含内容: 语料库文件: trials-...
-
商业分析主题建模数据集
数据集概述 该数据集专为主题建模实验构建,融合了合成的主题相关句子与来自可信商业和技术来源的真实改写摘录,确保主题准确性与语言多样性,为主题建模研究提供支持。 文件详解 文件名称: BUSINESS ANALYTICS Topic Modelling/mixed_ai_analytics_texts.csv 文件格式: CSV 字段映射:...
-
UVigoMED生物医学摘要语料库
数据集概述 该数据集为单语种(英文)单标签生物医学摘要语料库,包含从MEDLINE提取的九万两千六百六十一条摘要,按二十六种MeSH类别分类,适用于生物医学文本分类相关研究。 文件详解 UVigoMED/UVigoMED.zip:压缩包格式,可能包含语料库核心数据文件...
-
量子技术商业叙事的BERTopic与情感情绪分析数据集
数据集概述 本数据集包含量子技术商业叙事的BERTopic主题建模、情感及情绪分析相关文件,涵盖分析代码、主题分析结果表与原始文档文本,为研究量子技术商业叙事的主题分布及情感倾向提供支持。 文件详解 代码文件: 2025 BERTopic Work.py:Python格式,包含运行BERTopic、情感及情绪分析的代码,对应论文《Narratives...
-
欺骗性评论数据集
数据集概述 该数据集为基于欺骗提示标注的欺骗性评论数据集,源自纽约餐厅的谷歌地图英文评论,未刻意收集真实与欺骗性评论,而是在用户撰写后通过预设欺骗指标进行标注。 文件详解 文件名称:reviews_dataset.xlsx 文件格式:Excel(.xlsx)...
-
埃及毒品相关刑事案件结构化数据集
数据集概述 本数据集为埃及毒品相关刑事案件的结构化法律数据,提取自政府授权的公开法律书籍,包含约二百条记录,涵盖指控、案情事实、法律推理、适用法律、判决结果等九个字段,以CSV格式存储,支持阿拉伯语法律文本处理相关研究。 文件详解 目录:Structured Dataset of Egyptian Drug-Related Criminal...
-
新手研究者引导式聊天机器人数据集
数据集概述 本数据集围绕新手研究者引导式聊天机器人的设计与评估展开,包含165名研究生的反馈数据,通过自然语言处理进行情感分析与情绪检测,探究该聊天机器人对研究综合能力提升的效果及用户态度。 文件详解 Guided Chatbot for Novice Researchers/Positive_Negative Comments from...
-
基于CORL的零样本分类实验数据集
数据集概述 该数据集为论文《Combining Ontology and Reinforcement Learning for Zero-shot Classification》的实验数据,围绕基于本体与强化学习的零样本分类(ZSC)任务构建,包含实验所需的训练、测试数据及工具文件。 文件详解 核心数据文件:...
-
库尔德语方面级情感分析数据集
数据集概述 该数据集是首个公开的库尔德语索拉尼方言方面级情感分析数据集,填补了低资源语言自然语言处理研究的空白。包含四千余条餐厅评论领域的四元组情感分析数据,采用波斯-阿拉伯文字书写,适用于机器学习模型的训练、微调与基准测试。 文件详解 核心数据文件(位于 KurdABSA Aspect Based Sentiment Analysis Dataset...
-
BOISHOMMO_标准化多标签孟加拉语仇恨言论数据集
数据集概述 该数据集是针对低资源语言孟加拉语的多标签仇恨言论分析资源,含2499条社交媒体评论,覆盖10个仇恨类别,标注经多数投票确定,含英文翻译,支持跨语言研究,突出标签不平衡性,适用于模型鲁棒性测试与不平衡分析。 文件详解 文件名称:BOISHOMMO Dataset.zip 文件格式:ZIP压缩包(.zip)...
-
数据2型糖尿病候选基因文本挖掘参考数据集
数据集概述 该数据集是用于2型糖尿病候选基因文本挖掘的参考数据,包含疾病-基因关联的证据或参考句子,将关联信息分为Yes、No、Ambiguous、X四类,对应正负关联、模糊关联及无关关联,为训练文本挖掘分类器提供支持。 文件详解...
-
自报对儿童有性兴趣男性的性兴趣与性自控力眼动追踪研究数据集
数据集概述 该数据集是针对自报对儿童有性兴趣男性的性兴趣与性自控力开展的首次眼动追踪研究数据,包含受试者人口学信息、性取向分类及眼动指标等核心内容。 文件详解 文件名称:Jordan_Data.csv 文件格式:CSV 核心字段: Subject_num:受试者编号 Group:分组 forenic_patient:法医患者标识...
-
X网络威胁情绪分析数据集2025
数据集概述 该数据集包含约503,456条X平台(原Twitter)推文,主要语言为英语、西班牙语和法语,时间范围覆盖2024年8月至2025年3月。数据聚焦网络安全威胁相关公众话语,记录推文内容、互动数据及用户基础信息,用于情绪分析研究。 文件详解 文件名称:twitter_sentiment_dataset.csv...



