HM8882,COM
2023年12月底,在一位齐齐哈尔同学的带领下,宋川和另外两位南方同学来到东北。“小土豆”“小芋头”“小饭团”“大苞米”一行戴上大皮帽,裹上厚围巾,穿上在延吉批发市场现买的大棉裤,一路喝着延边脊骨汤、吃着哈尔滨大肘子和齐齐哈尔烧烤,看着“大大大大大猫咪”东北虎,品味着打雪仗中“胜败”的欢乐,感受着长白山和哈尔滨冰雪大世界的冷与“热”。在东北这片新奇的冰雪天地,此前从未见过雪的宋川,平均每天要发3条朋友圈,“不用说景点,任何路边的一捧雪都会是不期而遇的欣喜”。
“总书记来之前的几天一直在下雪,附近的国道上积雪已经没过了膝盖,路边的竹子都被冰雪压弯了,房檐下的冰溜拖得好长。”江西井冈山神山村老支书彭水生没想到总书记会冒着严寒来村里考察。那天是2016年2月2日,恰好是南方的小年。在人群中,彭水生激动地握住总书记的手说:“天气那么冷、路那么远,你还到我们穷山沟来,是我们穷山沟的福气。”
虽然大模型发展如火如荼,但大模型高质量语料短缺已成为全球共性问题。公开资料显示,大模型对数据供给要求极高。比如,训练GPT-4和Gemini Ultra大概需要4万亿至8万亿个单词。麻省理工学院等高校研究人员预测,到2026年之前,机器学习数据集可能会耗尽所有可用的高质量语料数据。研究机构EpochAI亦公开表示,最早在2024年,人类就可能会陷入训练数据荒,届时全世界的高质量训练数据都将面临枯竭。OpenAI也公开表达过对数据告急的担忧。
据全国大学生计算机系统能力大赛技术委员会主任、教育部计算机类专业教指委副秘书长高小鹏介绍:“我们将数据库赛道纳入全国大学生计算机系统能力大赛,一是期望通过大赛牵引教学;二是我们需要培养一大批自主计算技术的核心人才,而OceanBase既是自主研发的技术且性能在业界首屈一指;三是数据库开发能帮助学生在思考问题的系统性、全面性基础之上,进一步提升工程实施能力。”