-
泰卢固语罗马化文本数据集TeluguRomanizedTextDataset-teachingmachine
泰卢固语罗马化文本数据集TeluguRomanizedTextDataset-teachingmachine 数据来源:互联网公开数据 标签:泰卢固语,罗马化,文本数据,自然语言处理,数据集,语言学,机器翻译,文本分析 数据概述: 该数据集包含泰卢固语文本的罗马化转写数据,记录了泰卢固语文本与其对应的罗马字母转写版本。主要特征如下:... -
推特人类与机器人账号分类数据集TwitterHuman-BotsDataset-danieltreiman
推特人类与机器人账号分类数据集TwitterHuman-BotsDataset-danieltreiman 数据来源:互联网公开数据 标签:社交媒体,机器学习,数据集,账号分类,文本分析,网络行为,人工智能,网络安全 数据概述: 该数据集包含来自推特平台的用户账号数据,记录了人类账号与机器人账号的特征信息,用于账号分类任务。主要特征如下:... -
酒店评论地理位置分析数据集HotelReviewLocationAnalysis-pradeepsiva
酒店评论地理位置分析数据集HotelReviewLocationAnalysis-pradeepsiva 数据来源:互联网公开数据 标签:酒店评论, 地理位置, 文本分析, 情感分析, 数据挖掘, 市场调研, 用户行为, 旅游行业 数据概述: 该数据集包含来自不同来源的酒店评论数据,记录了用户对酒店的评价及其地理位置信息。主要特征如下:... -
邮件清洗数据集EmailCleanedDatasets-ashishgoraniya
邮件清洗数据集EmailCleanedDatasets-ashishgoraniya 数据来源:互联网公开数据 标签:邮件数据,数据清洗,文本分析,自然语言处理,机器学习,垃圾邮件检测,数据预处理,电子邮件 数据概述: 该数据集包含经过清洗处理的电子邮件数据,主要用于文本分析、垃圾邮件检测等研究。主要特征如下:... -
医疗对话数据集MedicalDialogueData-snjyor
医疗对话数据集MedicalDialogueData-snjyor 数据来源:互联网公开数据 标签:医疗,对话,数据集,自然语言处理,医学,人工智能,文本分析,问答系统 数据概述: 该数据集包含医疗相关的对话数据,记录了患者与医生或智能医疗系统之间的交流内容。主要特征如下: 时间跨度:数据记录的时间跨度不明确,可能涵盖多个时间段的对话。... -
数学公式图像与MathML数据集MathematicalFormulaImageandMathMLDataset-teslanicola
数学公式图像与MathML数据集MathematicalFormulaImageandMathMLDataset-teslanicola 数据来源:互联网公开数据 标签:数学公式, 图像识别, MathML, 数据集, 计算机视觉, 文本分析, 公式检测, 机器学习 数据概述: 该数据集包含数学公式的图像及其对应的MathML表示。主要特征如下:... -
新闻真伪识别文本数据集NewsCredibilityIdentificationTextDataset-ritchiepulikottil
新闻真伪识别文本数据集NewsCredibilityIdentificationTextDataset-ritchiepulikottil 数据来源:互联网公开数据 标签:新闻, 文本分类, 虚假新闻, 自然语言处理, 机器学习, 标题, 作者, 文本分析, 二元分类 数据概述:... -
法国司法判决文本分析数据集FrenchJudicialRulingTextAnalysis-tournevis
法国司法判决文本分析数据集FrenchJudicialRulingTextAnalysis-tournevis 数据来源:互联网公开数据 标签:司法判决, 法律文本, 法国, 文本分析, 历史数据, 自然语言处理, 案例研究, 法律研究 数据概述: 该数据集包含来自法国司法系统的判决文本,记录了关于案件裁决的详细信息。主要特征如下:... -
尼泊尔新闻数据集NepaliNewsDataset-niranjanshrestha
尼泊尔新闻数据集NepaliNewsDataset-niranjanshrestha 数据来源:互联网公开数据 标签:新闻,尼泊尔,数据集,文本分析,自然语言处理,机器学习,信息提取,新闻分类 数据概述: 该数据集包含来自尼泊尔的新闻数据,记录了尼泊尔国内外的新闻报道和新闻文章。主要特征如下: 时间跨度:数据记录的时间范围从2014年到2020年。... -
文本质量评估预测数据集TextQualityAssessmentPrediction-dingyan
文本质量评估预测数据集TextQualityAssessmentPrediction-dingyan 数据来源:互联网公开数据 标签:文本分析, 语言评估, 机器学习, 自然语言处理, 文本质量, 评分预测, 文本特征, 模型训练 数据概述:... -
心理健康文章摘要分析数据集MentalHealthArticleSummaryAnalysis-terrychanorg
心理健康文章摘要分析数据集MentalHealthArticleSummaryAnalysis-terrychanorg 数据来源:互联网公开数据 标签:心理健康, 摘要, 文本分析, 自然语言处理, 摘要生成, 情感分析, 文本长度, 语料库 数据概述: 该数据集包含来自互联网的文章,记录了文章标题、摘要、正文内容及其对应的URL。主要特征如下:... -
英语作文评分预测模型数据集EnglishEssayScoringPredictionModelDataset-thajime
英语作文评分预测模型数据集EnglishEssayScoringPredictionModelDataset-thajime 数据来源:互联网公开数据 标签: 英语作文, 评分预测, 机器学习, 自然语言处理, 文本分析, 模型训练, 语言评估, 交叉验证 数据概述:... -
加密货币领域情感分析推文数据集CryptocurrencyDomainSentimentAnalysisTweetsDataset-fabioturazzi
加密货币领域情感分析推文数据集CryptocurrencyDomainSentimentAnalysisTweetsDataset-fabioturazzi 数据来源:互联网公开数据 标签:加密货币,情感分析,社交媒体,数据集,自然语言处理,机器学习,文本分析,金融科技 数据概述:... -
Quora问答平台问题对数据集QuoraQuestionPairsDataset-bhattacharjeeajay12
Quora问答平台问题对数据集QuoraQuestionPairsDataset-bhattacharjeeajay12 数据来源:互联网公开数据 标签:自然语言处理,问答系统,数据集,文本分析,机器学习,语义相似度,文本匹配,信息检索 数据概述: 该数据集包含来自Quora问答平台的问题对数据,记录了用户提交的成对问题及其相似性标签。主要特征如下:... -
语言模型与人类文本对比数据集LLMvsHumanTextComparisonDataset-mohamedlotfy50
语言模型与人类文本对比数据集LLMvsHumanTextComparisonDataset-mohamedlotfy50 数据来源:互联网公开数据 标签:自然语言处理,文本对比,数据集,机器学习,语言模型,人类文本,人工智能,文本分析 数据概述:... -
新闻文章内容挖掘预处理数据集NewsArticleDataContentMiningPreprocessedDataset-tousifmdaminfaisal
新闻文章内容挖掘预处理数据集NewsArticleDataContentMiningPreprocessedDataset-tousifmdaminfaisal 数据来源:互联网公开数据 标签:新闻分析,内容挖掘,数据集,文本分析,自然语言处理,机器学习,数据预处理,信息提取 数据概述:... -
人工智能与人类文本对比数据集AIandHumanTextComparisonDataset-naveenfream
人工智能与人类文本对比数据集AIandHumanTextComparisonDataset-naveenfream 数据来源:互联网公开数据 标签:自然语言处理,文本分类,ai生成,人类写作,机器学习,文本分析,语言模型,数据挖掘 数据概述:... -
俄罗斯媒体真伪新闻数据集RussianMediaFakeandRealNewsDataset-danielsbuls
俄罗斯媒体真伪新闻数据集RussianMediaFakeandRealNewsDataset-danielsbuls 数据来源:互联网公开数据 标签:新闻媒体,数据集,真伪识别,文本分析,机器学习,信息传播,数据分析,新闻研究 数据概述: 该数据集包含来自俄罗斯媒体的新闻文章数据,记录了新闻内容的真伪标签及相关特征。主要特征如下:... -
文本嵌入转换数据集-jainhemang
文本嵌入转换数据集-jainhemang 数据来源:互联网公开数据 标签:文本分析,自然语言处理,数据集,嵌入,语义相似度,机器学习,深度学习,向量空间 数据概述: 该数据集包含了经过转换的文本嵌入数据,用于分析文本的语义信息和相似度。主要特征如下: 时间跨度: 数据未明确时间范围,但通常涵盖了近年来常用的文本语料。 地理范围:... -
编程问答社区问题文本数据集ProgrammingQ-ACommunityQuestionTextData-nandhinirjs
编程问答社区问题文本数据集ProgrammingQ-ACommunityQuestionTextData-nandhinirjs 数据来源:互联网公开数据 标签:编程问答, 文本分析, 自然语言处理, 问答系统, 文本挖掘, 社区数据, 机器学习, 语料库 数据概述:...