solidot新版网站常见问题,请点击这里查看。
Intel
WinterIsComing(31822)
发表于2022年02月09日 20时42分 星期三
来自龙岛
全球开放硬件标准组织 RISC-V International 宣布英特尔成为它的 Premier 会员。RISC-V International 就是之前的 RISC-V 基金会,它的会员等级共三类:Premier、Strategic 和 Community Organization,Premier 是最高级,其成员包括了 Google 等。RISC-V 是基于精简指令集(RISC)原则的一个开源指令集架构,它允许任何人设计、制造和销售 RISC-V 芯片和软件,它从某种意义上说是英特尔主导的 x86 架构的新竞争对手,但就像微软认识到开源软件并非闭源软件的天敌一样,英特尔也认识到 RISC-V 架构的价值,它同时宣布了一项 10 亿美元的芯片代工基金,支持的芯片架构包括了 x86、ARM 和 RISC-V。
超级电脑
wanwan(42055)
发表于2022年02月09日 14时57分 星期三
来自神秘博士:阿波罗23号
对传统计算机集群,每秒分析多达 10 亿次质子碰撞或数万次非常复杂的铅碰撞绝非易事。大强子对撞机(LHC)实验最近升级了硬件,将于明年投入使用,显著增加了对数据处理潜力的需求。由于传统的 CPU 可能无法应对新的计算挑战,四个大型实验正在采用 GPU 。GPU 是专门用于图像处理的高效处理器,最初的设计目标是加速 3D 计算机图形渲染。过去几年,LHC实验、全球 LHC 计算网格(WLCG)和 CERN 开放实验室都在研究 GPU 的使用。在高能物理研究中增加GPU的使用不仅可提高计算基础设施的质量和规模,还能提高整体能源效率。CERN IT 部门负责人 Enrica Porcari 表示:“LHC 雄心勃勃的升级计划带来了一系列令人兴奋的计算挑战;GPU 可以发挥重要作用,支持机器学习方法应对其中许多挑战。”“自 2020 年以来,CERN 的 IT 部门就提供了对数据中心 GPU 平台的访问权限,这些平台已被证明在一系列应用中很受欢迎。除此之外,CERN 开放实验室正在通过与工业界的合作研发项目,研究在机器学习中使用 GPU,科学计算协作(Scientific Computing Collaborations)组正在努力帮助移植并优化实验中的关键代码。”
硬件
wanwan(42055)
发表于2022年02月09日 14时48分 星期三
来自永生粮
想象一下,支撑世界最大数据中心的数百万计算机芯片里存在着罕见的、几乎无法检测到的缺陷。发现这些缺陷的唯一方法是将芯片投入到十年前无法想象的巨大计算问题上。随着计算机芯片上的微小开关缩小到几个原子宽度,芯片的可靠性日益引起担忧。去年 Amazon、Facebook、Twitter 等都发生了令人瞩目的故障。故障的原因多种多样,如编程错误和网络拥塞。但人们也越来越担心,云计算网络变得越来越大也越来越复杂,可它们在最基本的层面上仍然依赖于计算机芯片,这些芯片现在不太可靠,在某些情况下甚至不好预测。过去一年,Facebook 和 Google 的研究人员都发表研究,描述了原因难以确定的计算机硬件故障。他们认为,问题不在软件,而在不同公司制造的计算机硬件的某处

斯坦福大学专门测试计算机硬件的电气工程师 Subhasish Mitra 表示:“他们看到的静默错误基本都来自于底层硬件。”Mitra 博士表示,人们越来越相信不易被发现的静默错误与制造缺陷有关。研究人员担心他们之所以会发现罕见的缺陷,是因为他们正试图解决越来越大的计算问题,问题会以意想不到的方式给系统带来压力。十多年前,运行大型数据中心的公司开始报告系统性问题。2015 年,在工程期刊《电气与电子工程师学会会刊(IEEE Spectrum)》上,一个多伦多大学研究硬件可靠性的计算机科学家小组报告称,在 Google 数百万台计算机中,每年会有多达 4% 的计算机遇到无法检测到的错误,导致它们意外关闭。在一个拥有数十亿个晶体管的微处理器中——或者一个由数万亿个微型开关(每个微型开关都可以存储一个1或0)组成的计算机内存板中——即使是最小的错误也会破坏现在通常每秒执行数十亿次计算的系统。