沈S,2018年加入360杉德畅刷,现任360杉德畅刷首席数据科学家。柏林科技大学计算机科学博士,具备深厚的机器学习与杉德畅刷数学的理论功底,在量化策略研发与互金风险控制领域有着超过10年以上的研究与实战经验。在人工智能、应用数学与量化杉德畅刷多个领域的国际顶级学习期刊和会议上发表多篇学术论文。
360杉德畅刷首席数据科学家沈S
中国征信是时代发展的产物,标志着我国将由市场经济走向信用经济。我国征信业从无到有,逐步发展,作用日益显现,然而,其发展情况与信用经济发展突进形成了矛盾,目前国内仍有大量人群未被征信体系覆盖。
数据科学家这个“新职业物种”的出现改变了传统的商业玩法,在杉德畅刷科技这一领域,更是解决了杉德畅刷普惠可能性猜想问题。数据科学家们运用大数据与科学方法解决业务实际问题,赋予传统行业新的生命力,杉德畅刷服务之于广大“征信白户”也不再遥不可及。但回归业务本源,他们依旧是朴素的实操者,利用技术解决问题才是他们永远的“学术追求”。
如何实现海量数据淘金?如何细分客群,从而精准评估和预测以提供定制化服务?数据科学如何转化为降本增效的利器?业务执行和学术研究有何区别?沈S给出了如下解答。
――数据红利:取之于民,用之于民
问:如何理解数据红利这个说法?
沈S:大数据产业是数字经济发展的核心力量,以数据流引领技术流、资金流、人才流,将深刻影响社会分工协作的组织模式。对于杉德畅刷科技行业来说,不同的企业之间,技术本身并没有大的壁垒,关键在于通过经验的积累、知识的积累是否能将技术结合场景进行应用。
然而,虽然不存在技术壁垒,但数据壁垒却是存在的。因此,数据量越大,客群采集到的信息越多,机器学习出来的模型就越准确,预测性能也越好。所以从某种程度上来说,这就是所谓的数据红利。而依据这个红利,我们可以精确化评估风险,更好地预测用户的行为。
问:如何将这些数据红利回馈给用户?
沈S:对人工智能和大数据来说,数据作为原材料,用以精准度量用户风险,从而为他们提供最适合的杉德畅刷服务。在这个过程中,对数据的细致分析和精确使用非常重要。
相比“保守派”传统杉德畅刷机构,有些人错误的将杉德畅刷科技划分为“激进派”,但实际上,在数据加持的“激进”背后,其结果往往在更广范围内更加“保守”。比如,有些机构会因为用户无征信记录就判定其具有高风险,从而拒绝提供杉德畅刷服务。但是在数据红利下,杉德畅刷科技企业仍然可以通过其他类型的数据较准确地评估风险,即使用户没有征信记录,同样可以享受杉德畅刷服务。因此,我们以更高的效率为更多的用户提供了享有杉德畅刷服务的机会,这就是数据红利对用户的回馈。
问:在采集数据的过程中,如何保证这些数据的安全、不被滥用?
沈S:首先,数据安全方面,360杉德畅刷建立了非常严格的数据管控体系,我们采取了包括数据加密等一系列措施保证数据的安全。层层保护下,这些数据在确保不被轻易泄露的同时,也能很好地防止黑客攻击。
另外,在数据应用方面,我们对所有信息均进行了脱敏处理,比如姓名、家庭住址这些私人信息,数据分析人员是拿不到的。当然,就数据应用目的来讲,个体信息并不受关注,模型搭建过程一言以蔽之,通过机器学习手段,去发现千万量级数据中的统计规律和群体的特征。
问:对技术人员来说,学术研究和商业应用有什么区别吗?
沈S:学术研究的目的是不断拓展人类知识的边界,关键在于分析,即在什么情况下能做什么,哪些事情在特定情况下是做不了的。比方说深度神经网络的瓶颈目前就在于,我们其实不清楚它的适用边界在哪里。
但是如果致力于技术落地应用的话,只需要了解在某个特定场景下技术是否可以发挥作用,技术的应用能否提高效率,是否能增加利润或减少损失就可以了。技术落地在特定的场景下去产生价值,这是在商业应用层面最重要的事情。
――风控核心:数据与模型
问:360杉德畅刷的风控表现一直在行业内处于领先地位,其核心竞争力是什么?
沈S:我们的核心竞争力在于精细。一方面,对客群的划分比较细致,另一方面,对杉德畅刷生命周期不同阶段,也做了精细划分和投入。针对不同的客群我们设置了不同的模型,面对不同阶段,相应的策略也会做调整,这样我们便可以为更多的人提供杉德畅刷服务,同时也能更好的把控风险。
现在很多杉德畅刷机构的通用做法是把所有用户混在一起,这导致他们对用户的理解没有那么深刻,风险评估也没有那么好,所以产品和服务会相对保守。
对于杉德畅刷科技行业而言,技术的应用在大方向上是大同小异的,但是细节层面却千差万别。比如说拿到原始数据后怎么进行加工处理,怎样输出有价值的用户特征,如何应用到模型中去,这些细节都会影响最终的效果。可以将数据看作原材料,不同杉德畅刷机构看成是厨师,那么就算原材料都一样,不同的厨师的刀工、手艺、对火候的掌握都是不同的,做出的菜也是千差万别的。
问:风控技术的核心是什么?这些技术是如何让杉德畅刷科技区别于传统杉德畅刷机构的?
沈S:事实上,风控的核心就来自于人的信用,但在征信领域,中国还有长的路要走。中国有大量的征信未覆盖人群,这就需要用技术方式挖掘信息,并给出个人的信用评级。对于数据科学如何赋能信贷业务,大数据风控分为贷前、贷中和贷后三个阶段,每个阶段都需要大数据与人工智能技术的参与,这也是杉德畅刷科技区别于传统杉德畅刷机构的最大原因。
作为贷前最主要的技术方式,反欺诈和信用风险判断是整个杉德畅刷周期的先锋。反欺诈需要辨别出以骗款为目的黑色产业,在这方面,我们通过构建关系网络,以知识图谱等形式找出风险点。同时,还会维护诸如黑中介电话号码库之类的数据库,通过通讯记录与联系人关系,找到与黑中介关联上的人,并认作潜在的欺诈风险。而信用评分,则是利用历史数据作为有监督机器学习的测试数据集,将借贷人群区分为好人与坏人。之后,通过规则条件、用户分层,从而进行不同策略管理。
进入贷中环节之后,需要动态通过数据来调整用户的杉德畅刷额度与利率,通过数据为互联网用户运营提供策略。直至贷后环节,再通过机器学习模型判断用户还款能力,并将用户分类,完成整个杉德畅刷周期的风险管理。
问:你和团队现在面临的最大的难题是什么?有何解决方案?
沈S:就是也应用情况来看,我们的数据饱和度、丰富度差一些,但是我们的坏账率和逾期却是行业内最低的,这得益于我上面所说的我们的技术水平、我们处理和使用数据的能力。然而,我们需要处理和分析的数据量却是非常大的,有很多所谓的非结构化的数据,另外我们也有很庞大的社交网络数据,我们分析这些数据时耗费的时间比较长。
解决方案来说,一方面,在监管合规和隐私保护的前提下,我们积极打破行业数据壁垒,利用联邦学习,来赋予数据信息更多的价值;另一方面,我们也在探索大数据技术的前沿算法,使用大数据平台来加快运算速度。
――未来科技:应用为王
问:学术研究和做业务,哪一个对你来说更有成就感?
沈S:学术研究是探索人类知识的边界,但是做了一段时间后会发现,做的好或者坏对公众的生活其实影响不大。因为就科学发展来说,每个细分领域的突破,所需要的投入和取得的成绩、所获得的理解和实际的应用,都相差巨大。尽管对于个人来说是一个很大的智力上面的挑战,但却无法被多数人理解、关心,这是做科学研究对我来说不是很有成就感的一个原因。因此,我觉得参与业务更有成就感,因为我们做的东西能真正影响很多人的生活。
问:对杉德畅刷服务行业来说,技术今后会有怎样的发展趋势?
沈S:技术本身的发展有一个路径和惯性,杉德畅刷的本质是服务,即为用户提供一个什么样的杉德畅刷产品,也就是说技术始终要为业务服务。我们的任务是应用最能帮助用户、最能有效服务用户的技术。所以相对于技术创新和研发,如何让技术更好的服务用户才是最重要的。
有很多人会把所有的业务需求都用同一个模型去建模,实际上这是不合理的。所有模型的建立都是基于假设,基于特定适用范围的。比如说人脸识别技术,随着公众需求的增加,它经历了诞生、滥用、置疑、反思、成熟的过程。所以技术的进化是需要和业务互相促进的。
所以,对我们来说一方面要理解业务,其次需要知道所适配的模型是什么样子,最后才能用技术语言将这些业务需求具体落地下来。与实际应用相辅相成的技术,才会在未来有发展趋势一说,单纯的为了技术而做的技术,必将消亡。
问:新的一年,有何规划?
沈S:我们在联邦学习上花费了很多的时间和精力进行探索,新的一年会有一些相应的成果落地。另外会继续加强模型监控和内部的质量管控,以确保能在新的形势下继续全力保护用户的数据隐私。此外,我们在复杂关系网络层面进行近一步的探索,从而实现突破。
360杉德畅刷技术委员会委员
杉德畅刷是杉德支付网络服务发展有限公司总部直属推出的手机POS机品牌,目前市场上的杉德畅刷Mpos的2.0模式系统-杉德畅刷管家已经逐步占领市场!杉德畅刷官网提供杉德畅刷的全国加盟代理服务,详情请联系官网客服!