文章提交注意事项:
请在发布文章时用HTML代码加上至少一条新闻来源的链接;原创性消息,可加入相关信息(如涉及公司的网址)的链接。有任何问题,邮件至:he.fang#zhiding.cn
注意:收到邮件乱码的用户请修改客户端的默认字体编码,从"简体中文(GB2312)"修改为"Unicode(UTF-8)"。
solidot新版网站常见问题,请点击这里查看。
Solidot 公告
投 票
热门文章
热门评论
- 笑看外挂 (1 points, 一般) by cnma_001 在 2025年04月03日13时47分 星期四 评论到 韩国游戏工作室竞争开发星际争霸新作
- 一个数据参考 (1 points, 一般) by hhding 在 2025年03月31日09时06分 星期一 评论到 AI 数据中心太多了
- 非技术的说法 (1 points, 一般) by hhding 在 2025年03月31日08时56分 星期一 评论到 AI 数据中心太多了
- 主体错误 (1 points, 一般) by solidot1740402558 在 2025年02月24日21时10分 星期一 评论到 Starlink 面临越来越多的竞争
- 先能过了小米高考再说 (1 points, 一般) by ooxx 在 2025年01月06日15时43分 星期一 评论到 小米修改了引导程序解锁政策
- (1 points, 一般) by 18611782246 在 2024年12月18日18时06分 星期三 评论到 司机死于阿尔茨海默病的可能性较低
- BaD kEyBoArD: eXtRa SpAcE (1 points, 一般) by lot 在 2024年12月11日04时10分 星期三 评论到 高温环境可能加速衰老
- BaD kEyBoArD: tYpO (1 points, 一般) by lot 在 2024年12月11日04时09分 星期三 评论到 Goolge 宣布了新量子芯片 Willow
- 喵喵喵 (1 points, 一般) by solidot1733326472 在 2024年12月04日23时35分 星期三 评论到 澳大利亚面临太阳能供大于求
- 懂了 这就去安装刺客信条 (1 points, 一般) by Craynic 在 2024年11月27日19时36分 星期三 评论到 微软临时阻止安装刺客信条等育碧游戏的 PC 更新 Windows 11 24H2
全球开放硬件标准组织 RISC-V International 宣布英特尔成为它的 Premier 会员。RISC-V International 就是之前的 RISC-V 基金会,它的会员等级共三类:Premier、Strategic 和 Community Organization,Premier 是最高级,其成员包括了 Google 等。RISC-V 是基于精简指令集(RISC)原则的一个开源指令集架构,它允许任何人设计、制造和销售 RISC-V 芯片和软件,它从某种意义上说是英特尔主导的 x86 架构的新竞争对手,但就像微软认识到开源软件并非闭源软件的天敌一样,英特尔也认识到 RISC-V 架构的价值,它同时宣布了一项 10 亿美元的芯片代工基金,支持的芯片架构包括了 x86、ARM 和 RISC-V。
对传统计算机集群,每秒分析多达 10 亿次质子碰撞或数万次非常复杂的铅碰撞绝非易事。大强子对撞机(LHC)实验最近升级了硬件,将于明年投入使用,显著增加了对数据处理潜力的需求。由于传统的 CPU 可能无法应对新的计算挑战,四个大型实验正在采用 GPU 。GPU 是专门用于图像处理的高效处理器,最初的设计目标是加速 3D 计算机图形渲染。过去几年,LHC实验、全球 LHC 计算网格(WLCG)和 CERN 开放实验室都在研究 GPU 的使用。在高能物理研究中增加GPU的使用不仅可提高计算基础设施的质量和规模,还能提高整体能源效率。CERN IT 部门负责人 Enrica Porcari 表示:“LHC 雄心勃勃的升级计划带来了一系列令人兴奋的计算挑战;GPU 可以发挥重要作用,支持机器学习方法应对其中许多挑战。”“自 2020 年以来,CERN 的 IT 部门就提供了对数据中心 GPU 平台的访问权限,这些平台已被证明在一系列应用中很受欢迎。除此之外,CERN 开放实验室正在通过与工业界的合作研发项目,研究在机器学习中使用 GPU,科学计算协作(Scientific Computing Collaborations)组正在努力帮助移植并优化实验中的关键代码。”
想象一下,支撑世界最大数据中心的数百万计算机芯片里存在着罕见的、几乎无法检测到的缺陷。发现这些缺陷的唯一方法是将芯片投入到十年前无法想象的巨大计算问题上。随着计算机芯片上的微小开关缩小到几个原子宽度,芯片的可靠性日益引起担忧。去年 Amazon、Facebook、Twitter 等都发生了令人瞩目的故障。故障的原因多种多样,如编程错误和网络拥塞。但人们也越来越担心,云计算网络变得越来越大也越来越复杂,可它们在最基本的层面上仍然依赖于计算机芯片,这些芯片现在不太可靠,在某些情况下甚至不好预测。过去一年,Facebook 和 Google 的研究人员都发表研究,描述了原因难以确定的计算机硬件故障。他们认为,问题不在软件,而在不同公司制造的计算机硬件的某处。
斯坦福大学专门测试计算机硬件的电气工程师 Subhasish Mitra 表示:“他们看到的静默错误基本都来自于底层硬件。”Mitra 博士表示,人们越来越相信不易被发现的静默错误与制造缺陷有关。研究人员担心他们之所以会发现罕见的缺陷,是因为他们正试图解决越来越大的计算问题,问题会以意想不到的方式给系统带来压力。十多年前,运行大型数据中心的公司开始报告系统性问题。2015 年,在工程期刊《电气与电子工程师学会会刊(IEEE Spectrum)》上,一个多伦多大学研究硬件可靠性的计算机科学家小组报告称,在 Google 数百万台计算机中,每年会有多达 4% 的计算机遇到无法检测到的错误,导致它们意外关闭。在一个拥有数十亿个晶体管的微处理器中——或者一个由数万亿个微型开关(每个微型开关都可以存储一个1或0)组成的计算机内存板中——即使是最小的错误也会破坏现在通常每秒执行数十亿次计算的系统。
斯坦福大学专门测试计算机硬件的电气工程师 Subhasish Mitra 表示:“他们看到的静默错误基本都来自于底层硬件。”Mitra 博士表示,人们越来越相信不易被发现的静默错误与制造缺陷有关。研究人员担心他们之所以会发现罕见的缺陷,是因为他们正试图解决越来越大的计算问题,问题会以意想不到的方式给系统带来压力。十多年前,运行大型数据中心的公司开始报告系统性问题。2015 年,在工程期刊《电气与电子工程师学会会刊(IEEE Spectrum)》上,一个多伦多大学研究硬件可靠性的计算机科学家小组报告称,在 Google 数百万台计算机中,每年会有多达 4% 的计算机遇到无法检测到的错误,导致它们意外关闭。在一个拥有数十亿个晶体管的微处理器中——或者一个由数万亿个微型开关(每个微型开关都可以存储一个1或0)组成的计算机内存板中——即使是最小的错误也会破坏现在通常每秒执行数十亿次计算的系统。