-
孟加拉方言孤立词美学评分二分类数据集BanglaLekhaIsolated-AestheticScore-2ClassDataset-ferdouszislam
2025年5月28日 30 20 9
孟加拉方言孤立词美学评分二分类数据集BanglaLekhaIsolated-AestheticScore-2ClassDataset-ferdouszislam 数据来源:互联网公开数据 标签:方言研究,语音识别,美学评分,数据集,机器学习,二分类,语言分析,人工智能 数据概述:... -
社交媒体语言词汇转换数据集SocialMediaLanguageVocabularyTransformation-elfiramayas
2025年4月29日 30 12 9
社交媒体语言词汇转换数据集SocialMediaLanguageVocabularyTransformation-elfiramayas 数据来源:互联网公开数据 标签:社交媒体, 文本处理, 词汇转换, 语言分析, 口语化, 数据清洗, 自然语言, 机器学习 数据概述:... -
印地语文本语句数据集HindiTextStatements-krishna000
2025年4月29日 30 24 7
印地语文本语句数据集HindiTextStatements-krishna000 数据来源:互联网公开数据 标签:印地语, 文本数据, 语言分析, 自然语言处理, 文本挖掘, 语料库, 情感分析, 机器翻译 数据概述: 该数据集包含来自不同来源的印地语文本语句。主要特征如下: 时间跨度:数据未明确标注时间,可视为静态文本语料。... -
马拉地语新闻数据集MarathiNewsTFDataset-harshitjnu
2025年4月26日 30 15 8
马拉地语新闻数据集MarathiNewsTFDataset-harshitjnu 数据来源:互联网公开数据 标签:新闻,语言分析,数据集,自然语言处理,文本分类,机器学习,印度语言,数据挖掘 数据概述: 该数据集包含来自马拉地语新闻媒体的文章,记录了马拉地语新闻的文本内容。主要特征如下: 时间跨度:数据记录的时间范围从2016年到2018年。... -
雅思写作数据集IELTSWritingDataset-sebasga79
2025年4月26日 30 29 8
雅思写作数据集IELTSWritingDataset-sebasga79 数据来源:互联网公开数据 标签:雅思,写作,数据集,英语学习,语言分析,教育评估,自然语言处理,学术研究 数据概述:该数据集包含来自雅思考试写作部分的数据,记录了考生的写作样本及其评分。主要特征如下: 时间跨度:数据记录的时间范围从2010年到2020年。... -
数据2014至2016年婴儿女孩名字数据集BabyGirlNames2014-2016Dataset-stephaniejones
2025年4月26日 30 18 6
2014至2016年婴儿女孩名字数据集BabyGirlNames2014-2016Dataset-stephaniejones 数据来源:互联网公开数据 标签:婴儿名字,数据集,人口统计,社会研究,语言分析,文化研究,教育研究,流行趋势 数据概述:... -
摩洛哥方言语言学研究数据集MoroccanDialectDataset-yassinemekrany
2025年4月25日 30 10 9
摩洛哥方言语言学研究数据集MoroccanDialectDataset-yassinemekrany 数据来源:互联网公开数据 标签:语言学,方言研究,数据集,语音识别,自然语言处理,非洲文化,机器学习,语言分析 数据概述: 该数据集包含来自摩洛哥的方言语音和文本数据,记录了摩洛哥方言的发音,词汇和语法特征。主要特征如下:... -
西班牙语歌曲歌词数据集SpanishSongsLyricsDataset-pinooxd
2025年4月24日 30 20 9
西班牙语歌曲歌词数据集SpanishSongsLyricsDataset-pinooxd 数据来源:互联网公开数据 标签:音乐,歌词,数据集,语言分析,自然语言处理,文化研究,机器学习,多语言 数据概述: 该数据集包含来自互联网公开渠道的西班牙语歌曲歌词数据,记录了多种西班牙语歌曲的歌词文本。主要特征如下:... -
阿拉伯方言数据集DialectArabicDataset-arawee
2025年4月24日 30 30 9
阿拉伯方言数据集DialectArabicDataset-arawee 数据来源:互联网公开数据 标签:阿拉伯语,方言研究,数据集,语言分析,机器学习,自然语言处理,语音识别,文化研究 数据概述: 该数据集包含来自多个阿拉伯国家的方言语音和文本数据,记录了阿拉伯语在不同地区的方言特征。主要特征如下: 时间跨度:数据记录的时间范围从近年到现代。... -
阿拉伯语仇恨言论检测数据集ArabicHateSpeechDetectionDataset-malkim
2025年4月24日 30 15 2
阿拉伯语仇恨言论检测数据集ArabicHateSpeechDetectionDataset-malkim 数据来源:互联网公开数据 标签:仇恨言论,语言分析,数据集,机器学习,文本分类,社会媒体,自然语言处理,情感分析 数据概述: 该数据集包含来自阿拉伯语社交媒体平台的文本数据,记录了用户发布的内容及其是否被标记为仇恨言论。主要特征如下:... -
韩国极右翼网站WOMAD仇恨言论数据集KoreanExtremistWebsiteWOMADHateSpeechDataset-captainnemo9292
2025年4月23日 30 12 10
韩国极右翼网站WOMAD仇恨言论数据集KoreanExtremistWebsiteWOMADHateSpeechDataset-captainnemo9292 数据来源:互联网公开数据 标签:仇恨言论,数据集,极右翼,社交媒体,语言分析,自然语言处理,社会学,网络安全... -
澳大利亚总理公开演讲与访谈文本数据集2020-2021-mattrosinski
2025年4月23日 30 15 9
澳大利亚总理公开演讲与访谈文本数据集2020-2021-mattrosinski 数据来源:互联网公开数据 标签:澳大利亚,总理,演讲,访谈,文本数据,政治,公共记录,语言分析,情感分析,主题分析 数据概述:... -
元学习共读理解数据集MetaLearningforCommonLitReadingComprehensionDataset-syndri224
2025年4月23日 30 28 2
元学习共读理解数据集MetaLearningforCommonLitReadingComprehensionDataset-syndri224 数据来源:互联网公开数据 标签:元学习,阅读理解,数据集,自然语言处理,机器学习,教育研究,语言分析,学术资源... -
单词统计与频率分析数据集WordStatisticsandFrequencyAnalysisDataset-ment696
2025年4月23日 30 24 3
单词统计与频率分析数据集WordStatisticsandFrequencyAnalysisDataset-ment696 数据来源:互联网公开数据 标签:语言分析,文本挖掘,数据集,频率统计,自然语言处理,词汇研究,机器学习,教育研究 数据概述:... -
卡内基梅隆大学印地语英语混合语数据集CMUHinglishDataset-abhishek28069
2025年4月23日 30 30 5
卡内基梅隆大学印地语英语混合语数据集CMUHinglishDataset-abhishek28069 数据来源:互联网公开数据 标签:印地语英语混合语,数据集,自然语言处理,多语言研究,机器学习,语言分析,文本挖掘,语言技术 数据概述:... -
电影行业数据洞察全面解析电影市场动态
2025年4月23日 31 21 5
标题:电影行业数据洞察全面解析电影市场动态 数据内容:该数据集包含了丰富的电影相关信息,涵盖了电影的预算、类型、主页链接、唯一标识符、关键词、原始语言、原始标题、剧情概述、流行度、制作公司、制作国家、上映日期、收入、时长、使用的语言、状态、标语、标题、平均评分和评分数量等详细信息。 数据来源:互联网公开数据... -
巴马腊法语平行语料库数据集-ozaresearch1
2025年4月23日 30 17 4
巴马腊法语平行语料库数据集-ozaresearch1 数据来源:互联网公开数据 标签:巴马腊,法语,平行语料库,机器学习,翻译,文本生成,语言分析 数据概述:... -
印地语MBTI人格类型数据集HindiMBTIPersonalityTypeDataset-rachitj180
2025年4月22日 30 15 5
印地语MBTI人格类型数据集HindiMBTIPersonalityTypeDataset-rachitj180 数据来源:互联网公开数据 标签:人格类型,MBTI,印地语,心理学,数据集,机器学习,语言分析,社会研究 数据概述: 该数据集包含来自印地语社区的MBTI人格类型数据,记录了不同个体在印地语环境下的MBTI人格类型信息。主要特征如下:... -
卡拉巴赫战争推特数据分析集-用户与事件2020至2022-yantashe
2025年4月22日 30 27 4
卡拉巴赫战争推特数据分析集-用户与事件2020至2022-yantashe 数据来源:互联网公开数据 标签:卡拉巴赫战争,推特分析,社交媒体,用户行为,冲突分析,语言分析,地缘政治 数据概述: 本数据集包含了2020年至2022年间与卡拉巴赫战争相关的推特记录,共计数万条。每条推特记录了推特的基本信息、发布内容、用户特征以及相关标签。数据字段包括:... -
乌克兰新闻数据集2023年12月31日至2024年1月9日-shyshcuk
2025年4月22日 30 16 6
乌克兰新闻数据集2023年12月31日至2024年1月9日-shyshcuk 数据来源:互联网公开数据 标签:乌克兰新闻,时政报道,语言分析,新闻内容,时间序列,媒体研究 数据概述: 本数据集收录了2023年12月31日至2024年1月9日期间乌克兰语新闻文章的集合,包含三类关键字段: 出版时间: 表示每篇新闻文章的发布时间戳。 标题:...