写于 2017-09-12 01:12:24| 千赢国际手机版| 专栏
<p>布兰科望远镜观测到的DeCAM / DeCALs星系图像遗产调查正在根据一组光学和红外成像数据生成天空的推断模型目录,包括从北半球可见的14,000度的河外天空,三个光学带和四个红外波段图像:暗能量天空调查伯克利实验室的科学家创建了一个新的统计分析模型,旨在增强现代天文学中最受时间考验的工具之一:天空调查传统的根源深入天文学从伽利略和哥白尼到哈勃望远镜和霍金一样,科学家和哲学家们几个世纪以来一直在思考宇宙的奥秘,用方法和模型扫描天空,这些方法和模型在过去的二十年里一直没有太大变化</p><p>现在,基于伯克利实验室的研究合作天体物理学家,统计学家和计算机科学家正在寻求通过新的统计分析模型设计Celeste来解决问题加强现代天文学最受时间考验的工具之一:天空调查天文学家日常活动的核心组成部分,调查用于绘制和编目天空区域,为大量物体提供燃料统计研究,并使有趣或稀有物体成为可能更详细的研究但今天分析来自这些调查的图像数据集的方式仍然存在,即黑暗时代“有非常传统的做天文调查的方法可追溯到摄影板,”David Schlegel说</p><p> ,劳伦斯伯克利国家实验室的天体物理学家和重子振荡光谱调查的首席研究员(BOSS,SDSS的一部分)和DECam遗产调查(DECaLS)的联合PI“许多术语也可以追溯到这一点,例如,我们仍然谈论有一个盘子和比较板块,显然我们已经超越了“令人惊讶的是,第一次电子调查 - 斯隆数码l天空调查(SDSS) - 仅在1998年开始捕获数据而今天,全球每周7天,每天24小时运行多个调查和高分辨率仪器,每年收集数百TB的图像数据,来自多个设施的科学家能够轻松访问并且分享这些数据仍然是难以捉摸的事情此外,一百多年前或更多的实践继续在天文学中激增 - 从接近每个调查图像分析的习惯,好像这是他们第一次看到天空这样过时的术语,如作为“震级系统”和“六十进制”,可以让潜在的合作者在天文学之外摸不着头脑这样的惯例就像他喜欢的那样令人沮丧的施莱格尔“这里有关于数据如何用于天文学的历史,以及语言和术语反映了很多问题,“他说”例如,幅度系统 - 它不是一些线性系统有多亮对象是,它是一个可追溯到几千年的任意标签但是你仍然可以拿起任何天文学论文并且他们都使用量级系统“当涉及分析来自天空调查的图像数据时,施莱格尔确定现有的方法可以改进同样 - 尤其是考虑到DECaLS等下一代调查中出现的更为复杂的计算挑战以及大型天气调查望远镜(LSST)等更高分辨率的仪器“我们处理天文数据分析的方式是通过'数据减少,''他说“你拍摄一张图像,对它应用一种检测算法,进行一些测量,然后在该图像中制作一个目录,然后你拍摄另一张相同部分的天空图像然后你说,”哦,让我假装我不知道这里发生了什么,所以我首先要识别物体,测量这些物体,然后制作这些物体的目录</p><p>这是独立完成的</p><p>每个图像所以你不断进一步深入到这些数据缩减目录中,永远不会回到原始图像“分层模型这些挑战促使Schlegel与Berkeley Lab的MANTISSA合作(利用可扩展算法大规模加速科学新技术) )项目由国家能源研究和科学计算中心(NERSC)的Prabhat领导,该中心是DOE科学用户设施办公室 “为了应对这一重大挑战,我们聘请了加州大学伯克利分校,哈佛大学,卡内基梅隆大学和Adobe研究院的顶尖研究人员,”Prabhat团队在过去一年中开发了Celeste,这是一种用于编目星,星系和其他光源的分层模型</p><p>加州大学伯克利分校统计系博士生杰夫·雷吉尔解释了宇宙,并在7月份的第32届机器学习国际会议上发表了一篇概述塞莱斯特的论文的主要作者</p><p>新模型也将使天文学家能够为了确定用于光谱仪目标的有希望的星系,定义他们可能希望进一步探索的星系,并帮助他们更好地了解暗能量和宇宙的几何形状,他补充说:“我们想要从根本上改变这一点的方式是天文学家使用这些数据的方式,“Schlegel说”Celeste将是一个更好的模型,用于识别天空和校准器中的天体物理源每个望远镜的参数我们将能够在数学上定义我们正在解决的问题,这与传统方法有很大不同,在这种方法中,这是一组启发式方法,你得到这个对象目录,然后你试着问这个问题:数学上我刚刚解决了什么问题</p><p>“此外,Celeste有可能大大减少天文学家目前用于处理图像数据的时间和精力,Schlegel强调”十到十五年前,你会得到天空的图像而且你甚至都不确切知道你在天空中的确切位置所以你要做的第一件事就是把它拉到电脑上然后点击星星并尝试识别它们以确切地找出你的位置你会每个单独的图像手动执行“应用统计”为了改变这种情况,Celeste使用机器学习和应用统计中常见的分析技术,但在天文学中却没有那么多模型是在一个名为t的代码上构建的Tractor,由Dustin Lang开发,当时他是普林斯顿大学的博士后研究员</p><p>“大多数天文图像分析方法都会查看一堆像素并运行一个基本上对像素值进行算术运算的简单算法,”Lang说,以前是Carnegie Mellon的博士后,现在是多伦多大学的研究员和Celeste团队的成员“但是使用拖拉机,我们创建了一个完整的描述性模型,我们可以比较到实际图像,然后调整模型,使其对特定恒星实际上看起来像什么的声明与观察结果相匹配它对关于什么对象存在更明确的陈述以及对这些对象在数据中的样子的预测“Celeste项目采用了这个概念更进一步,实施统计推断,建立一个完全生成模型,以数学方式定位和表征天空中的光源统计模型通常从数据开始并向后看以确定导致数据的原因,加州大学伯克利分校统计学教授,Celeste团队的另一名成员Jon McAuliffe解释说</p><p>但在天文学中,图像数据分析通常从未知的开始:天空中物体的位置和特征“在科学中,我们做了很多事情就是采取一些很难的东西,并尝试将其分解成更简单的部分,然后将这些部分重新组合在一起,”麦考利夫说:“这就是发生的事情</p><p>层次模型棘手的部分是,有这些假设或想象的数量,我们必须推理它们即使我们没有去观察它们这是统计推断的来源我们的工作是从像素强度开始图像和向后工作到光源的位置和它们的特征是什么“到目前为止,该小组已经使用Celeste分析了NERS上的SDSS图像,整个SDSS图像和SDSS图像集C的爱迪生超级计算机,McAuliffe说这些初步运行帮助他们改进和改进模型并验证其超越当前最先进的天体定位方法和测量颜色的能力“最终目标是采取到目前为止所生成的所有光度数据都将持续生成并运行单个作业并随着时间的推移继续运行并不断改进这个综合目录,“他说 第一个重要的里程碑是在NERSC上同时对整个SDSS数据集进行分析</p><p>然后研究人员将开始添加其他数据集并开始构建目录 - 与SDSS数据一样,它可能会被安置在科学网关上NERSC总之,Celeste团队希望目录能够收集和处理大约500TB的数据,或大约1万亿像素“据我所知,这是科学中最大的图形模型问题,实际上需要一个超级计算平台来运行推理算法,“Prabhat说”由Jon McAuliffe,Jeff Regier和Ryan Giordano(加州大学伯克利分校),Matt Hoffman(Adobe Research)以及Ryan Adams和Andy Miller(哈佛)开发的核心方法绝对是尝试解决问题的关键</p><p>这个尺度“塞莱斯特的下一次迭代将包括类星体,它们具有独特的光谱特征,使得它们更难以与其他光源区分</p><p>类星体的建模我对于提高我们对早期宇宙的理解很重要,但它提出了一个巨大的挑战:最重要的对象是那些遥远的对象,但远处的对象是我们拥有最弱信号的哈佛大学的安德鲁米勒目前正在工作的对象关于模型的这一补充,它将高保真光谱测量与调查数据结合起来,以改进我们对偏远类星体的估计“到目前为止全世界的天文学界还没有建立所有的一个参考目录,这可能有点令人惊讶</p><p>在过去的15年里,全世界许多不同的望远镜正在拍摄的光源,“麦考利夫说:”但我们认为我们可以提供帮助</p><p>这将是一个对未来天文学家和宇宙学家来说非常有价值的目录“资料来源:Kathy Kincade,