未来组织科技趋势分析生成文本数据集-2023-gladdenme

未来组织科技趋势分析生成文本数据集-2023-gladdenme 数据来源:互联网公开数据 标签:NLP,文本生成,ManaGPT,未来科技,组织变革,人工智能,社会机器人,虚拟现实,增强现实

数据概述: 本数据集包含4,080篇由ManaGPT-1020大型语言模型生成的文本,这些文本是针对特定输入序列生成的。ManaGPT-1020是一个开放源代码模型,可以在Hugging Face的“transformers”Python包中下载和使用。该模型包含15亿个参数,能够根据用户提供的输入序列生成完整句子的后续部分。模型在超过509,000字的专门英语语料库上进行了微调,该语料库涵盖了组织未来研究领域的内容,特别擅长生成关于先进AI、社会机器人、泛在计算、虚拟现实、神经网络增强等“后人类化”技术在组织中角色的分析、预测和建议。

数据集中的4,080篇文本是通过102个不同的提示生成的,每个提示生成20篇响应。这102个输入序列是通过12个不同的“主题”与17个不同的“模式变体”组合而成的。主题包括6个单数主题:“未来的职场”、“技术后人类化”、“组织中的人工智能使用”、“机器人老板”、“智能同事”、“5.0社会中的企业文化”。还包括6个复数主题:“社会机器人”、“人机混合组织”、“智能公司”、“未来的后人类化职场”、“网络增强工人”、“5.0社会中的组织”。

对于6个单数主题,17个模式变体包括一个空白变体(空字符串)和其他16个短语,这些短语为输入序列提供了不同形式的“模式着色”,表示不同程度的确定性、概率、可预测性、逻辑必然性或道德义务。具体模式变体如下: - "" - "是" - "不是" - "将" - "将会是" - "可能" - "可能永远不" - "很有可能" - "很有可能不会" - "应该" - "可以" - "不能" - "永远不能" - "必须" - "不能" - "像" - "将会像"

对于复数主题,模式变体相同,只是将“是”替换为“都是”。

在极少数情况下(仅在使用空字符串作为输入的一部分时),模型未能生成除输入序列之外的任何输出。

数据用途概述: 该数据集适用于自然语言处理研究、组织未来预测分析、教育与培训、人工智能与科技趋势研究等多个领域。研究人员可以利用这些生成的文本进行模式识别、数据分析和趋势探索;教育工作者可以将这些文本作为教学材料,帮助学生理解未来组织的发展趋势和技术变革;政策制定者可以根据这些数据评估新兴技术对组织的影响,为未来的政策制定提供参考。

packageimg

数据与资源

附加信息

字段
版本 1.0
数据集大小 0.26 MiB
最后更新 2025年4月21日
创建于 2025年4月21日
声明 当前数据集部分源数据来源于公开互联网,如果有侵权,请24小时联系删除(400-600-6816)。