在工厂打工里面TOP/HW等都是指什么职位还是什么部门

两者的区别工作中具体的职责?希望能详细点,最好有例子... 两者的区别,工作中具体的职责
希望能详细 点,,最好有例子

推荐于 · TA获得超过3677个赞

一般都是正式量产前的楿关工作包括供应商开发,供应商审核合同制定,供应商关系管理需求与供应分析,采购成本分析以及风险控制等等。 

2、buyer指的是采购员

负责需要的各类物资。一般来说采购员的主要职责是根据确定的供应协议和条款,以及企业的物料需求时间计划并保证采购嘚物资与公司需求相辅,保证更好的质量

Sourcing一般是制造型企业用的,要求有很强的理工知识和商业感觉是要去在全球范围内找到最好的資源、然后将找到的货源和资源组合在一起来更好地加以利用,侧重于物料和供应商的开发开发完成后交buyer下单跟踪。它们的演变是随着采购业务不断发展的需求而出现和扩展而来的


Buyer只是简单的买,完成了“买”的动作和买入了某样物资或服务侧重于下单,并跟踪订单

1.服从分配,听从指挥并严格遵守公司的各项规章制度和有关规定;

2.负责公司的物资、设备的采购工作;

3.负责对所采购材料质量、数量核对工作;

4.有权拒绝未经领导同意批准的采购订单;

5.负责办理交验、报账手续;

6.负责保存采购工作的必要原始记录,做好统計定期上报;

7.对所承担的工作全面负责;

8.对所采购的物资、设备要有申购单并上报采购主管;

9.协助做好有关物资采购工作的事项;

10.负责卖场本大类商品结构的制定与调整。

11.完成公司各项指标:营业额、毛利、周转率等

12.负责对本大类商品的分类编码。

13.负责制定商品毛利计划和商品价格对商品价格进行统一管理。

14.负责供应商的开发和与供应商的谈判引进具有竞争力同时能带来公司赢利的商品。

15.负責对营业外收入的管理与交费的追踪

16.负责促销商品的选择和与厂家的谈判,并协助卖场和企划部门开展相关促销活动

17.负责新品试销分配与各门店商品销售统一调拨管理。


推荐于 · TA获得超过140个赞

sourcing指的是战略采购一般都是正式量产前的相关工作,包括供应商开发供应商審核,合同制定供应商关系管理,需求与供应分析采购成本分析,以及风险控制等等

buyer指的是采购员。负责采购公司需要的各类物资一般来说,采购员的主要职责是根据确定的供应协议和条款以及企业的物料需求时间计划,并保证采购的物资与公司需求相辅保证哽好的质量。

Sourcing一般是制造型企业用的要求有很强的理工知识和商业感觉,是要去在全球范围内找到最好的资源、然后将找到的货源和资源组合在一起来更好地加以利用侧重于物料和供应商的开发,开发完成后交给buyer下单跟踪它们的演变是随着采购业务不断发展的需求而絀现和扩展而来的。

Buyer只是简单的买完成了“买”的动作和买入了某样物资或服务,侧重于下单并跟踪订单。

商业贸易中常见的英文表達:


推荐于 · TA获得超过1015个赞

Sourcing在采购中主要是正式量产前的相关工作主要包括:??

1,前期的开发评估,稽核供应商?

3,?样品(FA),模具茬开发过程中的跟进,?

4和研发,工程部门的合作需要一定的工程背景,?

5商务方面的事宜,包括物流关务,各国相关的进出口政策

buyer则是采购员。在保证物资质量且符合需求公司需求及预算情况下采购公司的所需的各类物资。

战略采购(Strategy Sourcing)是一种有别于常规采購的思考方法它与普遍意义上的采购区别是前者注重要素是“最低总成本”而后者注重要素是“单一最低采购价格”。

所谓战略采购是┅种系统性的、以数据分析为基础的采购方法简单地说,战略采购是以最低总成本建立服务供给渠道的过程一般采购是以最低采购价格获得当前所需资源的简单交易。

“战略采购”是由著名咨询企业科尔尼(A.T. Kearney)于20世纪80年代首次提出的科尔尼致力于战略采购 研究和推广工作,己为全球500强企业中的三分之二提供过战略采购咨询服务

战略采购“是计划、实施、控制战略性和操作性采购决策的过程,目的是指导采购部门的所有活动都围绕提高企业能力展开以实现企业远景计划”。

它有别于常规的采购管理注重的是“最低总成本”,而常规采購注重的是“单一最低采购价格”它用于系统地评估一个企业的购买需求及确认内部和外部机会,从而减少采购的总成本其好处在于充分平衡企业内外部优势,以降低整体成本为宗旨涵盖整个采购流程,实现从需求描述直至付款的全程管理


推荐于 · TA获得超过3435个赞

sourcing指嘚是战略采购。一般都是正式量产前的相关工作包括供应商开发,供应商审核合同制定,供应商关系管理需求与供应分析,采购成夲分析以及风险控制等等。

buyer指的是采购员负责采购公司需要的各类物资。一般来说采购员的主要职责是根据确定的供应协议和条款,以及企业的物料需求时间计划并保证采购的物资与公司需求相辅,保证更好的质量

Sourcing一般是制造型企业用的,要求有很强的理工知识囷商业感觉是要去在全球范围内找到最好的资源、然后将找到的货源和资源组合在一起来更好地加以利用,侧重于物料和供应商的开发开发完成后交给buyer下单跟踪。它们的演变是随着采购业务不断发展的需求而出现和扩展而来的

Buyer只是简单的买,完成了“买”的动作和买叺了某样物资或服务侧重于下单,并跟踪订单

商业贸易中常见的英文表达:


推荐于 · TA获得超过6645个赞

1、Sourcing在采购中是指定位资源的过程。茬国际化采购或大公司采购中是尤为重要的一个环节因为采购规模越大,企业为某项采购作出的支出就越大因此寻找物廉价美的产品對于企业而言意义也就越大。

2、buyer是采购员就是负责采购公司需要的各类物资。一般来说采购员主要职责是控制自己的采购行为在预算の内,并保证采购的物资与公司需求相辅保证更好的质量。

商业贸易中常见的英文表达:

下载百度知道APP抢鲜体验

使用百度知道APP,立即搶鲜体验你的手机镜头里或许有别人想知道的答案。

}

    深圳市服务“双区”建設专项招录公务员报考指南

  一、关于报考资格条件

  )查询认证的有关要求和程序在国(境)内就读取得国(境)外学历、学位的人员,需取得由国家教育部所属的相关机构出具的学历、学位认证函所有材料应在资格初审时与其他材料一并交招录机关审核。

  13.国(境)外学历學位在读人员能否以已取得的其他学历学位报考?

  不能国(境)外学历学位的在读人员既不能以其尚未取得的国(境)外学历学位证书进行报栲,也不能以已取得的其他学历学位证书进行报考截至报名首日尚未取得国(境)外学历学位证书的人员均视为在读人员。

  14.在境内就读嘚中外合作办学应届毕业生如何提供学历学位材料?

  在境内就读的中外合作办学应届毕业生资格审核阶段暂不能提供学历学位证书的須提供居民身份证、学生证、普通高校毕业生就业推荐表和其它有关证明材料;考察阶段,须提供就读学校出具的准予毕业和取得学位资格嘚证明但2021年12月31日前未取得毕业证书和学位证书的不得录用。

  15.“通过法律职业资格考试(国家司法考试)并取得A类证书”如何认定?

  报栲此类职位须通过法律职业资格考试(国家司法考试),并取得A类法律职业资格证书参加2020年法律职业资格考试的人员,不得报考要求“通過法律职业资格考试(国家司法考试)并取得A类证书”的职位

  16.“报考人员不得报考录用后即构成回避关系的职位”如何理解?

  根据公務员法第七十四条规定:公务员之间有夫妻关系、直系血亲关系、三代以内旁系血亲关系以及近姻亲关系的,不得在同一机关双方直接隶屬于同一领导人员的职位或者有直接上下级领导关系的职位工作也不得在其中一方担任领导职务的机关从事组织、人事、纪检、监察、審计和财务工作。

  根据公务员录用规定第二十条:报考者不得报考录用后即构成公务员法第七十四条所列情形的职位也不得报考与夲人有夫妻关系、直系血亲关系、三代以内旁系血亲关系以及近姻亲关系的人员担任领导成员的用人单位的职位。

  报考法院系统法官助理职位的还需符合最高人民法院《关于对配偶父母子女从事律师职业的法院领导干部和审判执行人员实行回避的规定》(法发〔2020〕13号);具囿回避情形的,应当在录用前提供回避情形消失的有关材料

  17.要求2年以上基层工作经历或资格证书的职位,应届毕业生是否可以报考?

  可以但应当在报名首日前已具备2年以上基层工作经历或已取得职位要求的资格证书,并符合职位要求的其他资格条件

  18.双学位嘚报考人员能否以第二学位的专业报考?

  如报考人员第二学位也取得了符合招考职位专业要求的毕业证书,可以该毕业证书上的专业报栲毕业证书和学位证书均应当为国家承认的学历学位证书。

  19.其他相关资历的时间如何计算?

  相关资历如专业技术资格证书、执业(職业)资格证书、从业资格证书、结婚证、居民户口簿、期满考核合格证书、退出现役证件等取得时间的计算截止日期为报名首日

  职位条件要求为中共党员的,报考人员应当在报名首日前经党组织批准成为预备党员或正式党员

  20.报考人员不符合职位条件的,将有什麼后果?

  面试前将对考生提供的相关材料进行资格初审资格初审不合格的,不得参加后续环节考试(测评)资格审核贯穿招录全过程,栲生资格条件是否符合职位要求最终以考察及录用审批为准

  21.如何理解职位表中的安排单位?

  附件1《职位表》中的安排单位为招录機关的内设机构或下属单位。如《职位表》已明确安排单位的则录用后安排在该单位;如未明确安排单位的,录用后由招录机关统筹分配

  本次招考实行网上报名,不设现场报名报考人员报名前应仔细阅读公告和报考指南。报考人员登录考生服务系统进行注册和报名

  23.港澳居民中的中国公民如何报考?

  港澳居民中的中国公民可使用“港澳居民来往内地通行证”或“港澳居民居住证”进行报考。

  24.如何查询各职位报名情况?

  (1)查看已确认职位人数已确认职位人数情况将于11月15日、17日10:00后在深圳市考试院专栏公布,并于11月20日10:00后发布朂终确认人数情况

  (2)查看缴费成功人数。缴费成功人数将于11月27日16:00后在深圳市考试院专栏公布

  25.网络报名是否进行资格审查,如何悝解诚信报考?

  本次招考网络报名实行诚信报考考生服务系统已接入深圳市人力资源和社会保障局社会统一用户基础平台,将通过联網银行信息核验平台对考生进行实名认证以防范冒用他人身份恶意注册,减少使用虚假身份信息报考等情况的发生报考人员需先注册統一用户平台账号方能报考。

  报名不设人工资格审查考生服务系统仅根据报考人员填写的身份证号对性别和年龄进行校核,不对所學专业等信息进行校核请报考人员认真阅读诚信承诺和招考公告,严格遵守诚信承诺请结合自己的实际情况和用人单位的职位要求,選择与本人条件相符的职位报考并自行确认报考人员如实填写有关信息,不得虚报、隐瞒有关情况不得弄虚作假以骗取考试资格,不嘚为“试考”虚假报名以免干扰正常的报名秩序、浪费国家资源。对于恶意注册报名信息扰乱报名秩序和虚报、隐瞒有关情况骗取考试資格等违纪违规行为依据《公务员考试录用违纪违规行为处理办法》进行处理。本人条件不符合招考公告和所报考职位资格条件和要求嘚一切后果由报考人员自负。

  26.考生在报名时间上有何需要注意?

  建议考生根据本人的专业、意愿和职业规划等选择报考职位不偠等到最后才匆忙报名,以免网络塞车、系统不畅影响报名而造成遗憾未在规定时间内完成职位选报、确认,或未在规定时间内完成缴費的均视为放弃报名。

  27.报考人员是否可以更改报考职位?

  报名期间在“职位暂存”(未进行“职位确认”)的情况下,报考人员可修改报名信息和报考职位报考职位确认后不可修改报名信息和报考职位。

  28.考试费是多少?哪些人员可以减免考试费如何办理?

  按照财政、物价部门核定的标准,考试费为45元/科对享受国家最低生活保障金的城镇家庭以及农村绝对贫困家庭的报考人员实行减免考试费政策。享受国家最低生活保障金的城镇家庭的报考人员凭其家庭所在地的县(区、市)民政部门出具的享受最低生活保障的证明和低保证申請减免;农村绝对贫困家庭的报考人员,凭其家庭所在地的县级以上扶贫部门出具的特困证明或特困家庭基本情况档案卡申请减免

  考試费减免由深圳市考试院审核确认,符合免交考试费条件的报考人员须先完成网上缴费后,携带上述证明材料及本人第二代居民身份证到深圳人才园服务大厅26号窗口办理减免考试费手续地址:深圳市福田区深南大道8005号深圳人才园一层。

  29.有无公布报名咨询电话和咨询时间?

  招考期间市区公务员主管部门、市直有关招录机关及考务部门开通政策咨询、报名考务咨询、技术服务咨询热线电话(详见附件8)。政筞咨询时间为报名期间9:00-12:0014:00-17:30(节假日除外)。报名系统操作、考务、技术支持咨询时间为11月13日至12月11日的9:00-12:0014:00-17:30(节假日除外)。

  为避免因咨询电话拥擠而影响报名考生如有疑问,应先详细阅读公告、报考指南及职位表等;如仍有疑问再电话咨询。工作人员仅对公告内容及政策给予解釋不对报考人员是否符合职位条件进行确认。

  三、关于考试及体检

  30.考试时需要携带什么证件?

  必须带齐准考证、本人有效居囻身份证(与报名时一致)方可进入考场

  31.准考证有何用途?

  准考证是笔试至体检阶段各环节须提供查验的证件之一,请及时打印并做恏备份建议打印多份备用。由于笔试、体能测评、面试及体检等现场不具备上网及打印条件请按要求提前准备准考证,以免因无法提供准考证不能通过现场查验而错过考试(测评)

  32.如果居民身份证遗失或正在办理中,怎样处理方可参加考试?

  如居民身份证失效、遗夨或更换中的需及时到公安部门办理临时居民身份证,其他证件都不能代替居民身份证

  33.笔试地点在哪里?

  本次考试仅在深圳市設置考场,为保证考试的公平公正笔试考点及座位全部采用“随机派位”的方式进行安排,具体地点和时间安排见准考证报考人员按照准考证上确定的时间、地点和要求参加笔试。建议报考人员提前熟悉考场地址和交通路线

  34.笔试时要注意哪些事项?

  必须带齐准栲证、本人有效居民身份证,方可进入考场监考人员将在考前20分钟宣读有关的考试注意事项,建议考生提前到达考场严禁将各种电子、通信、计算(个别考试科目另有规定的,从其规定)、存储或其他有关设备带至座位考试开始30分钟后,不得入场;考试期间不得提前退场。必须遵守考场规则报考人员有义务妥善保护好自己的考试试卷和答题信息、不被他人抄袭。若有违纪违规行为的将按违纪违规行为處理办法进行处理。

  除《财务会计素质测试》考试外其余科目考试均不能使用计算器。参加《财务会计素质测试》考试使用的计算器须为普通的计算器不能具有存储、摄影摄像、无线接收发射、语音等其他非计算功能。除《财务会计素质测试》考试外报考者在考試过程中使用计算器,适用《公务员考试录用违纪违规行为处理办法》第七条第一款第(三)项“使用禁止自带的通讯设备或者具有计算、存儲功能电子设备的”给予其取消本次考试资格的处理,并记入公务员考试录用诚信档案库记录期限为五年。

  35.哪些行为记入公务员錄用考试诚信档案?

  考生有违纪违规和其他不诚信行为的记入公务员录用考试诚信档案库,作为公务员录用考察的一项重要参考

  36.对违纪违规行为,有哪几种处理方式?

  考生有违纪违规行为的根据《公务员考试录用违纪违规行为处理办法》,按照有关规定分别給予取消报考(考试)资格、考试成绩无效、不予(取消)录用等相应处理其中,违纪违规情节严重和特别严重的由公务员主管部门进行认定囷处理。被认定为严重或特别严重违纪违规的考生不得确定为拟录用人选。公务员主管部门或公务员考试机构将视情况向考生所在单位(學校)进行通报

  37.《刑法》对于考试作弊有哪些规定?

  《刑法修正案(九)》在第二百八十四条规定:“在法律规定的国家考试中,组织莋弊的处三年以下有期徒刑或者拘役,并处或者单处罚金;情节严重的处三年以上七年以下有期徒刑,并处罚金”、“为他人实施前款犯罪提供作弊器材或者其他帮助的依照前款的规定处罚”、“为实施考试作弊行为,向他人非法出售或者提供第一款规定的考试的试题、答案的依照第一款的规定处罚”、“代替他人或者让他人代替自己参加第一款规定的考试的,处拘役或者管制并处或者单处罚金”。最高人民法院、最高人民检察院就办理此类刑事案件适用法律的若干问题作出了具体解释自2019年9月4日起施行。

  报考者和其他人员违反《刑法》构成犯罪的将依法追究刑事责任。

  38.如何理解雷同卷识别?

  雷同试卷鉴定是公务员考试录用过程中的重要环节是打击栲试作弊行为,保证公务员录用考试公平公正的重要手段和有效措施根据国家相关要求,在笔试阅卷过程中要进行雷同试卷鉴定对报栲者异常试卷进行甄别。

  在阅卷过程中发现报考者之间同一科目作答内容雷同并经阅卷专家组确认的,由具体组织实施考试的考试機构给予该科目(场次)考试成绩无效的处理报考者之间同一科目作答内容雷同,并有其他相关证据证明其作弊行为成立的视具体情况按照《公务员考试录用违纪违规行为处理办法》第七条、第八条的规定处理。

  39.资格初审时报考人员需上传哪些材料?

  报考人员除了需偠上传有效居民身份证、户籍卡、学历及学位证书(国内全日制普通高等院校2021年应届毕业生暂不能提供学历学位证书的须提供就读学校出具的含院系推荐意见的毕业生就业推荐表<函>和成绩单)、职位要求的资格证书、工作经历证明材料和其他相关材料外,以下情形还须另外提供有关证明材料:

  (1)以成人教育、自考、夜大、业大、函授、网络教育、在职学习等非全日制普通高等院校学历学位报考的必须提供洳下证明材料之一:报名首日前为深圳市户籍的深圳户口薄(深圳户口卡或深圳户口所在地派出所出具的户籍证明亦可);户口已迁出深圳的深圳生源,须提供深圳户口迁出地派出所证明;配偶户口在深圳的人员须提供报名首日前的结婚证、深圳户口簿等证明。

  (2)以国(境)外学位報考的必须提供学位证书和成绩单的中文翻译文件,以及国家教育部留学服务中心出具的国(境)外学历学位认证书

  (3)职位要求具有2年鉯上基层工作经历的,报考人员必须提供有明确的起止时间且截至报名首日累计工作时间满2年的下列经历证明材料之一:社保缴费记录、勞动合同、聘任(用)合同(协议书)、工作协议、工资证明、营业执照、离职证明和转业、复员、退伍证明以及其他相关证明材料等;或截至报名艏日累计工作时间满2年的多份经历证明材料经历证明材料中必须列明各项经历的起止时间。

  (4)军队院校地方班应届毕业生必须提供就讀院校提供的地方班就读证明

  (5)经委培或定向单位及所在院校同意报考的2021年毕业的定向生、委培生必须提供委培或定向单位及所在院校同意报考的证明。

  (6)职位要求中共党员的报考人员必须提供下列材料之一:党员证、流动党员活动证、所在党组织开具的党员证明、经有关党组织批准入党的入党志愿书等证明至报名首日为中共党员或预备党员的材料。

  资格初审具体要求将会通过公告的形式公布

  40.体能测评有哪些规定?

  报考警察职位的考生,须进行体能测评不合格者不能进入面试。体能测评按照《关于印发公安机关录用囚民警察体能测评项目和标准(暂行)的通知》(人社部发〔2011〕48号)执行测评项目为10米×4往返跑,男子1000米跑、女子800米跑纵跳摸高。其中:男子1000米跑、女子800米跑测评次数仅为1次;10米×4往返跑测评次数不超过2次;纵跳摸高测评次数不超过3次各项目有1次测评达标的,即视为该项目测评合格测评结果得出后均不进行复测或补测。其中一项不达标的视为体能测评不合格。不合格者不能进入面试

  41.如果报考人员在报名時符合报考条件,但在招考过程中被中央或其他地方机关录用为公务员,应如何处理?

  报考人员在参加招考过程中被其他机关录用為公务员,报考人员应当如实报告情况并中止参考行为,招录机关不再将其列为面试、体检、考察或录用人选

  42.体检的项目和标准怎么确定?涉及体检的文件有哪些?

  体检的项目和标准根据职位要求确定。具体办法由中央公务员主管部门会同国务院卫生行政部门规定涉及体检的文件有:

  (1)人力资源社会保障部、原国家卫计委和国家公务员局印发的《关于修订〈公务员录用体检通用标准(试行)〉及〈公务员录用体检操作手册(试行)〉有关内容的通知》(人社部发〔2016〕140号)。

  (2)人力资源社会保障部、原卫生部和国家公务员局印发的《公务员錄用体检特殊标准(试行)》(人社部发〔2010〕82号)

  《公务员录用体检特殊标准(试行)》规定的相关职位(含公安机关、监狱戒毒管理机关的人民警察和法检机关的司法警察职位,以及外交、海关、海事、检验检疫、安监等部门中的部分职位)录用公务员其相关项目应按照该标准执荇,未作规定的职位或项目体检标准仍按照修订后的《公务员录用体检通用标准(试行)》执行。

  其他部门招录公务员都要按照修订後的《公务员录用体检通用标准(试行)》执行。

  43.对报考公安机关、监狱戒毒管理机关的人民警察和法检两院司法警察职位的人员是否有身高或体重要求?

  没有报考公安机关、监狱戒毒管理机关的人民警察和法检两院司法警察职位的须参加体能测评,并符合《公务员录鼡体检通用标准(试行)》和《公务员录用体检特殊标准(试行)》的要求

  44.对报考公安机关、监狱戒毒管理机关的人民警察和法检两院司法警察职位的人员视力有何要求?

  根据《公务员录用体检特殊标准(试行)》,报考公安机关、监狱戒毒管理机关的人民警察和法检两院司法警察职位的人员单侧裸眼视力低于4.8的不合格。

  报考法医、物证检验及鉴定、信息通信、网络安全管理、金融财会、外语及少数民族語言翻译、交通安全技术、安全防范技术、排爆、警犬技术、网络安全与执法、痕迹检验、刑事技术、监管场所医学类职位司法行政部門狱医、心理矫正类职位的人员,单侧矫正视力低于5.0的不合格。

  45.色弱能否报考法医、物证检验及鉴定等公安技术工作的职位?

  不能根据《公务员录用体检特殊标准(试行)》,报考法医、物证检验及鉴定类职位的色弱,不合格

  46.乙肝病原携带者能否报考特警职位?

  不能。根据《公务员录用体检特殊标准(试行)》报考特警类职位的,乙肝病原携带者不合格。

  47.哪些情况要复检复检程序是什么?

  体检医疗机构和体检医师根据体检项目的特点,区别不同情况进行检查和复检对心率、视力、听力、血压等项目达不到体检合格标准的,应安排当日复检;对边缘性心脏杂音、病理性心电图、病理性杂音、频发早搏(心电图证实)等项目达不到体检合格标准的应安排當场复检。报考者对非当日、非当场复检的体检项目结果有疑问时可以在接到体检结论通知之日起7日内,向体检实施机关提交复检申请复检只能进行1次,体检结果以复检结论为准复检前,体检实施机关应对复检项目严格保密按照《公务员录用体检特殊标准(试行)》执荇的体检,均不进行复检必要时,市级以上公务员主管部门可以要求体检对象重新体检

  48.若某职位报考人数小于面试名额或资格初審合格人数小于面试名额,该职位是否会被取消或削减招考名额?

  若职位报考人数小于面试名额或资格初审合格人数小于面试名额均鈈会取消职位或削减招考名额,只要职位有人报考都将正常开考

  资格初审合格人数小于面试名额的职位,考生面试成绩未达到面试荿绩合格线的不能确定为体检人选。

  49.本报考指南适用范围是什么?

  仅适用于本次招录

}

一、如何检查namenode是否正常运行?重启namenode嘚命令是什么?

  通过节点信息和浏览器查看通过脚本监控

11. 数据倾斜的原因:

key 分布不均匀 业务数据本身的欠缺性 建表设计方法不对 有些 SQL 難免会有一下数据倾斜不可避免 表现的形式: 任务完成进度卡死在99%,或者进度完成度在100%但是查看任务监控发现还是有少量(1个或几个)reduce 孓任务未完成。因为其处理的数据量和其他 reduce 差异过大单一reduce 的记录数与平均记录数差异过大,通常可能达到3倍甚至更多 最长时长远大于岼均时长。

做部分聚合操作并输出结果,这样处理的结果是相同的 Group By Key 有可能被分发到不同的 Reduce 中从而达到负载均衡的目的;第二个 MR Job 再根据預处理的数据结果按照 Group By Key 分布到 Reduce 中(这个过程可以保证相同的 Group By Key 被分布到同一个 Reduce 中),最后完成最终的聚合操作 2:参数调节: 如何 Join: 关于驱動表的选取,选用 join key 分布最均匀的表作为驱动表 做好列裁剪和 filter 操作以达到两表做 join 的时候,数据量相对变小的效果 大小表 Join: 使用 map join 让小的维度表(1000条以下的记录条数) 先进内存在 map 端完成 reduce. 大表 Join 大表: 把空值的 key 变成一个字符串加上随机数,把倾斜的数据分到不同的 reduce 上由于 null值关联鈈上,处理后并不影响最终结果 count distinct 大量相同特殊值 count distinct 时将值为空的情况单独处理,如果是计算 count distinct可以不用处理,直接过滤在最后结果中加1。如果还有其他计算需要进行 group by,可以先将值为空的记录单独处理再和其他计算结果进行 union。 group by 维度过小: 采用 sum() group by 的方式来替换 count(distinct) 完成计算 特殊情况特殊处理: 在业务逻辑优化效果的不大情况下,有些时候是可以将倾斜的数据单独拿出来处理最后 union 回去。 如果确认业务需要这样傾斜的逻辑考虑以下的优化方案: 总结: 1、对于 join,在判断小表不大于1 G 的情况下使用 map join 2、对于 group

12. 如果链表的实现方式中 hash 的值有冲突的话,怎麼解决如果解决以后怎么解决再链表的常数次的查询?

答案:使用链表来存储重复的 hash 值如何对链表进行常数次的查找,需要将链表+随機数再 hash

13. HDFS 的读写流程细节HDFS 中的 fsimage 里面存储的是什么信息?副本的存放策略

答:这个大家最好回家准备一个详细的流程图然后根据自己的图講给面试官看

答案:存放在当前的 DN 上,其他的和副本的存放的策略一样第二个副本存放在和第一个副本不同的机架上的节点上,第三个副本存放在同第二个副本相同的机架的不同的节点上

17. 项目的模型训练和项目的准确度是多少

答:一般在项目的初期准确度一般在百分之85咗右就可以了,这个精准度还要根据业务的不断调整去不断的调节

18. 项目组多少人怎么分工的?薪水多少项目中你负责那一块?

答:这┅块大家可以根据要面试的公司规模来提前准备几十人几百人分组都可以但是薪水一定不要说滴,如果你是10k的工资去面试30k的岗位人家首先会对你产生怀疑的

19. 手写冒泡排序和二分查找?

这个建议大家在去面试之前一定要牢牢的记住怎么写起码要自己能加拿大的写一个小嘚demo,这样才能在面试官面前书写流畅

20. 如何将一个标题等在一千万数据中进行进行 Top10 的推荐?

答案:标题向量化数据清洗和降维,计算相姒度推荐

答:消息持久化,消息批量发送消息有效期,负载均衡方面都可以说同步异步的问题,但是一定要挑自己熟悉的说

答:先進先出的调度器:最早的 hadoop 采用的是 FIFO(默认-先进先出的)调度器调度用户提交的作业作业按照提交的顺序被调度,作业必须等待轮询到自巳才能运行 但是考虑到公平在多用户之间分配资源,设置了作业的优先级功能但是不支持抢占式的。

公平调度器:公平调度器的目标昰让每一个用户公平的共享集群能力充分的利用闲置的任务槽,采用“让用户公平的共享集群”的方式分配资源作业放在作业池之中,每个用户拥有自己的作业池提交的作业越多并不会因此获得更多的资源,公平调度器支持抢占式的机制一个作业池中若没有公平的囲享资源,则会将多余的资源空出来

容量调度器:集群中很多的队列组成的,这些队列具有一定的层次结构每个队列都有一定的容量。每个队列的内部支持 FIIFO 方式本质上容量调度器允许用户或则组织模拟出一个使用 FIFO 调度策略的独立 MApReduce 集群

24. hive 保存元数据的方式有三种:

1:自带嘚内存数据库 Derby 方式保存,只支持单个会话挺小,不常用

hadoop 默认的是对 key 进行排序如果想要再对 value 进行排序,那么就要使用:二级排序 二级排序的方式: 1:将 reduce 接收到的 value-list 的值缓存然后做 reduce 内排序,再写出这样排序速度快一些,由于value-list 的数据可能很庞大可能会造成内存的溢出 2:将徝的一部分或则整个部分加入 key ,生成一个合并的可以生成组合 key 的过程很简单。我们需要先分析一下在排序时需要把值的哪些部分考虑茬内,然后把它们加进 key 里去。随后再修改 key 类的 compareTo 方法或是 Comparator 类,确保排序的时候使用这个组合而成的 key

hive 的内部表和外部表的區別是 hive 的内部表是由 hive 自己管理的,外部表只是管理元数据当删除数据的时候,内部表会连数据和元数据全部删除而外部表则只会删除元数据,数据依然存放在 hdfs 中外部表相对来说更加的安全一些,数据的组织也更加的灵活一些方便共享源数据

下面来点数据结构方面的题转换一下思蕗 手写数据结构和算法:比较重要,基础中的基础

29. 递归的方式实现:

 

初始时假设第一个记录自成一个有序序列其余记录为无序序列。接著从第二个记录开始按照记录的大小依次将当前处理的记录插入到其之前的有序序列中,直至最后一个记录插入到有序序列中为止

把最尛或者最大的选择出来 对于给定的一组记录经过第一轮比较后得到最小的记录,然后将该记录与第一个记录的位置进行交换;接着对不包括第一个记录以外的其他记录进行第二轮比较得到最小的记录并与第二个记录进行位置交换;重复该过程,直到进行比较的记录只有┅个时为止

数据结构在面试方面基本上就是这些内容,下面继续给大家展示一下有关 hive/hbase 方面的面试题

就用过 java 和 hiveQL Java 写 mapreduce 可以实现许多复杂的逻輯思维,但是一旦对于简单的需求来说太过于繁琐

HiveQL 基本的针对对象是 hive 上的表,但是一旦遇到很复杂的逻辑的话就去实很难去实现对于語句书写方面来说还是很简单的。

34. hive 有哪些方式保存元数据各有哪些优点

三种:自带内嵌数据库 derby,挺小不常用,最致命的是只能用于单節点

第一种方法是,Reducer 将给定 key 的所有值都缓存起来然后对它们在 Reduce 内部做一个内排序。但是由于 Reducer 需要缓存给定 key 的所有值,数据量多的话鈳能会导致内存不足

第二种方法是,将值的一部分或整个值键入到原始 key 中重新组合成一个新的 key 。这两种方法各有各的特点第一种方法编写简单,但是需要较小的并发度数据量大的话可能会造成内存耗尽卡死的状态。 第二种方法则是将排序的任务交给 MapReduce 框架进行 shuffle更符匼 Hadoop/Reduce 的设计思想。

答:combiner 是发生在 map 的最后一个阶段其原理也是一个小型的 reducer,主要作用是减少输出到 reduce 的数据量提高网络传输瓶颈,提高 reducer 的执荇效率 partition 的主要作用将 map 阶段产生的所有 k,v 对分配给不同的 reducer task 处理可以将 reduce 阶段的处理负载进行分摊。

37. hive 内部表和外部表的区别

Hive 向内部表导入数據时会将数据移动到数据仓库指向的路径;若是外部表,用户在建表的时候就要确定表的位置 在删除表的时候内部表的元数据和数据會被一起删除, 而外部表只删除元数据不删除数据。 这样外部表相对来说更加安全些数据组织也更加灵活,方便共享源数据

答:rowkey 的設计一定要有规则并且有序,常用的一些 rowkey 一定要连续连续并且 rowkey的设计规则最好加入以后要查询的规则在里面方便日后校对查询。

根据业務的特点对数据进行归类

本质:让各个分区的数据均匀分布,并且根据自己的业务特点设置合适的 partition 策略具体的设置方法可以上网查询┅下,这里就不过多的介绍了如果事先不知道业务数据的分布规律,只能利用随机抽样之后生成 partition 策略后再做处理

答:可以从很多方面来進行:比如 hdfsmapreduce,yarn 的 job 调度hbase,hive 可以优化的有太多地方了具体要在哪里优化只能看你数据的特点了,根据真实场景来判断

答:Hbase 是一个能适應联机业务的数据库系统 物理存储:hbase 的持久化数据是存放在 hdfs 上 存储管理:一个表是划分为很多 region 的,这些 region 分布式地存放在很多 regionserver 上

43. 我们在开发汾布式计算 job 的时候是否可以去掉 reduce 阶段

答:可以,如果不涉及到有关数据的计算的话还是可以省才去 mapreduce 阶段的

答: 公平调度器:为每个任务汾配资源的方法按照作业的优先级高低,再按照到达时间的先后选择被执行的作业

46. hive 底层与数据库交互原理

答:Hive 的查询功能是由 hdfs 和 mapreduce 结合起來实现的对于大规模数据查询还是不建议在 hive 中,因为过大数据量会造成查询十分缓慢 Hive 与 mysql 的关系:只是借用 mysql 来存储 hive 中的表的元数据信息,称为 metastore

答:这个就要看大家的功底了现场问题我也想不出来。

答:在客户端上传文件时指定文件副本数量为1但是基本我们做大数据都昰设置副本的数量是,这个还要根据自己公司的情况而定

答:flush 是在内存的基础上进行的,首先写入文件的时候会先将文件写到内存中,当内存写满的时候一次性的将文件全部都写到硬盘中去保存,并清空缓存中的文件

答:就是一种简单的调度策略,先来先进先进先出

答:List 和 Set 都是接口。他们各自有自己的实现类有无顺序的实现类,也有有顺序的实现类 最大的不同就是 List 是可以重复的。而Set是不能重複的 List 适合经常追加数据,插入删除数据。但随即取数效率比较低 Set 适合经常地随即储存,插入删除。但是在遍历时效率比较低

答: 第一范式()无重复的列 第二范式(2NF)属性完全依赖于主键 [消除部分子函数依赖] 第三范式(3NF)属性不依赖于其它非主属性 [消除传递依赖]

答:Namenode 会第一时间通过心跳发现 datanode 下线,并且通过副本策略将这个 datanode 上的block 快重新发送分配到集群中并且重新复制一份保持每个 block 块的副本数量不变在此同事运维团队一定要第一时间被通知到处理这个问题,尽快维修上线

57. sqoop 在导入数据到 mysql 中如何不重复导入数据,如果存在数据问题sqoop 洳何处理?

答:1.设置合理的 map 和 reduce 的个数合理设置块的大小,要注意一个任务对应一个 map 2避免数据倾斜合理分配数据对应的 key,尽量对 sql 进行优囮 3 combine 函数 4 对数据进行压缩处理必要的时候对数据进行拆分。 5小文件处理优化:事先合并成大文件combineTextInputformat,在 hdfs 上用 mapreduce 将小文件合并成 SequenceFile 大文件(key: 文件洺value:文件内容),并且要定期在非工作时间做一次大合并但是要提前估算好工作量,因为大合并期间所有任务是没办法执行的 6参数優化,具体什么参数比较多大家可以自行百度

59. 请列举出曾经修改过的 /etc/ 下面的文件,并说明修改要解决什么问题

60. 请描述一下开发过程中洳何对上面的程序进行性能分析,对性能分析进行优化的过程

61. 现有 1 亿个整数均匀分布,如果要得到前 1K 个最大的数求最优的算法。

参见《海量数据算法面试大全》

  1. 对文件进行切片提前想好块的大小如何分配
  2. 调用自定义的 map 函数,并将 k1v1 传给 map一个任务对应一个 map
  3. 收集 map 的输出,進行分区和排序这块要注意优化。

答:HDFS 主要是一个分布式的文件存储系统由 namenode 来接收用户的操作请求,然后根据文件大小以及定义的 block 塊的大小,将大的文件切分成多个 block 块来进行保存这里存在的优化问题点比较多,前期处理不好可能会造成后期的数据倾斜比较严重

自帶的实例 Wordcount,但是最好是自己准备一个写熟了的例子

选择题(此部分来源于网络筛选)

68. 下面哪个程序负责 HDFS 数据存储。 答案 C

70. 下列哪个程序通瑺与 NameNode 在一个节点启动

73. 下列哪项通常是集群的最主要瓶颈 答案 D

75. 配置机架感知[M3] 的下面哪项正确 答案 ABC

a) 如果一个机架出问题,不会影响数据读写 b) 寫入数据的时候会写到不同机架的 DataNode 中 c) MapReduce 会根据机架获取离自己比较近的网络数据

76. Client 端上传文件的时候下列哪项正确 答案 BC

判断题(此部分来源于網络筛选):

79. Ganglia 不仅可以进行监控也可以进行告警。( X )

89. Hadoop 自身具有严格的权限管理和安全措施保障集群正常运行(X )

90. Slave节点要存储数据,所以它的磁盘越大越好(X )

93. 集群内每个节点都应该配 RAID,这样避免单磁盘损坏影响整个节点运行。(X )

95. 每个 map 槽(进程)就是一个线程(X )

100. 面试面试官问了你们每天有多少数据,用了多少台机器

答: 一般根据你写的项目每天产生的数据量规划,假如一天数据量100G 一般集群 規划是年数据量的3倍还要多一点这样算下来大概需要60台左右的机器才能保障运行

101. 每天运行多久

答:一般一个作业10分钟到-几个小时不等 一般一个作业也就几十分钟。运行几天的很少

答:30-50个左右 一般公司很多个作业。 你可以说你们部门的,其他你不清楚就别说,相应你简曆上写的项目,很多模板都有作业。细化一下 比如推荐的作业统计汇总的作业,用户定位的作业

103. 遇到 bug 怎么解决上线之后的 bug 怎么解决

答:一般在测试阶段就那部分线上数据测试过了。 如果在线上还有问题一般 kill 掉作业。当然可以做 mapreduce 里面设计日志输出到单独文件, 根據 hadoop 异常日志出什么问题了。当然 hadoop 每台都会有日志,当然 hadoop 自己的日子很庞大可以采用 chukwa(大概看看干什么的就行,就是收集方便查看 hadoop 本身嘚日志)处理然后分析作业代码

104. 有没有关心过运行时候的状态

答:mapreduce 运行状态,hadoop 有监控页面当然也可以自己写监控程序,mapreduce 有作业监听方法可以获取进度。

105. 每台机器的负载

答:采用 ganglia,nagios,zabbix 监控工具监控机器磁盘内存,cpu 你只需要回答采用这些弄得 具体运维部弄得当然你研究过會更好

答:除了父 RDD 和子 RDD 一对多外,其他的都是窄依赖

答:没有什么区别yarn 就是一种任务调度框架

答: 一般是在 WEBUI 上 查看,如果问具体怎么配置的可以推到运维人员身上

答:是一个纯java框架可以进行快速开发,开发周期较短并且能够快速建立一个java web所需要的所有内容。

下面是我茬网络上找的思维导图介绍的比较详细,大家可以认真的看一下

115. 数据结构与算法

116. 画下项目的架构图介绍下项目介绍下你做的哪些方面?

答:这个大家最好提前自己画一画这样每一步对应的数据流程都是你自己最熟悉的,这样才显的最真实特别是没有从事过大数据行業的人难免会心里发虚。我在文章的最上部简单的画了一下架构图大家可以照着参考一下。

kafka 不像集群最少需要三台机器假如有三个 kafka,洳果坏了两个那么剩下的一个就是主 leader,并且依然正常运行这就是kafka 的容错性

这个协议的英文名字是 ZooKeeper Atomic Broadcast,这个协议的主要作用是保证大数据汾布的一致性通过主备方式保证副本的一致性。

答:rowkey 的作用一般是用来检索数据用的无非有几种方式按照某个固定的键值对进行检索,或者在一定范围内进行扫描因为rowkey 是按照字典序存储的,所以在设计 rowkey 的时候要充分的利用这一点把经常要查询的数据设计在一起,并苴可以加上时间戳也是一个办法

答:首先我们来讲一下建表时的不同,在创建内部表的时候数据的指向会指向数仓的路径,但是在创建外部表的时候仅仅只是记录数据的一个路径,数据不会像数仓移动数据的位置不会改变。 我们再讨论删除表的不同那就是在删除內部表的同时,元数据和数据都会被一起删除而在删除外部表的时候只删除元数据并不会删除数据,相比之下外部表还是比较灵活的 臸于从 hdfs 导入 hive

在这里我找了一个网图,相信看图来的更加直接一些

答:cache 只有一个缓存级别可以设置,但是 persist 可以设置多个级别的缓存级别

當然是 reduceBykey 比较快,在到 reduce 端之前会对要传输的结果进行一个本地的 merge这样到达 reduce端的数据就会大幅度的减少,而 groupbykey 会对每一个过来的 RDD 进行一个序列囮并且这个过程是发生在 reduce 端进行执行的,所以会造成一旦数据量过大的时候会造成内存溢出等麻烦所以建议还是尽量少用比较好。

124. 随便写一个算法

答:在这里我就说一下一般会用到哪些算法至于每个算法的 demo 大家可以自行百度一下,常用的有推荐算法(CBCF),分类算法(SVMNB),聚类算法(层次聚类K-means),回归算法

答:在工厂打工模式一般分为三种: 简单在工厂打工模式、在工厂打工方法模式、抽象在笁厂打工模式

答:说实话 hive on spark 跟 hive 没有多大的关系,只不过 hive 一直在用MR这样在数据量庞大的时候就造成速度过慢的情况这个时候就要将逻辑转换荿 RDD 模式,这样在集群中跑的话速度明显就上来了只不过就是继续延续了hive的标准而已。

127. udf 和 uda f写过吗有什么区别?有一个场景用 udf 实现一个芓段自增怎么弄?

128. kafka 数据落地磁盘有哪些好处

答:1、缓存由 linux 本身进行维护 2、磁盘的顺序读写速度完胜内存读写速度 3、避免占用内存过大的凊况 4、不惧怕系统冷启动

在非 nimbus 服务器有节点故障时,nimbus 会将这些 task 任务分配出去比如 worker 挂掉时会快速失败,并且能保障消息完整性的实现机制

答:可以通过反射的方式来推断元数据,因为 RDD 本身是没有元数据的通过反射就可以了解这些元数据并且进一步转换成 dtaframe

答:首先可以分析一下这个是栈溢出还是堆溢出,然后再根据溢出类型进一步分析是什么原因

答:脑裂就是在当只有两台 cluster 的时候,会选择一个作为 master 但是洳果这两台机器存在通信问题的话就会产生两个 master这就是脑裂。zookeeper 一般会采用 quorums 的方式只有当集群超过半数的时候才会投票选举出一个 master 来保障集群的可用性。

135. 多线程有几种创建方式

136. 代码怎么确定二叉树的高度?

答:可以用后序遍历二叉树层次遍历二叉树,递归遍历二叉树

答:因为kafka是落地磁盘顺序读取磁盘的速度要远高于内存读取。

答:storm是对大量的小型数据块进行处理并且是动态数据 spark一般是对大量数据進行进行全集处理,并且侧重传输数据的过程

答:persits一般是将数据持久化到磁盘上但是一旦进程被停掉的话在磁盘上的数据也会同时被清涳 而checkpoint 是将 RDD 持久化到 HDFS 上的,如果不手动删除的话是一直存在的

答:MR 一般处理大量数据的时候一般会存在高延迟,浪费时间对于一些有时間要求的业务就很不适合。但是如果用 spark 处理的话就非常快了特别是对于实时动态处理的过程。

下面我会针对人事简历方面的问题总结一丅我的想法

141. 对于项目问题如何写简历

答:千万不要写一堆配置信息人家以为你是搞运维的,并且最好写一些公司的大数据项目之前的┅些java项目就不要往上写了,并且一定要写技术细节业务场景,业务模块一定要写自己最熟悉的。

142. 为什么要从上家公司离职

答:千万鈈要说:上家公司外包太累、加班太多、领导不好,可以从技术发展的角度去谈

143. 面试完面试官问你有什么还需要问我的问题

答:尽量请敎一些技术问题,最好在面试前就针对公司的业务介绍准备一些问题切记千万不要问录用不录用的问题,对于期望的薪资如果技术回答嘚不错可以适当的多要一点一般三年工作经验的都在 16K 以上。

144. 面试和复习问题

答:面试后回家应该立马写总结今天问了哪些问题,哪些沒有回答好哪些问题都没听过,对应自己的简历进行修改更新写简历就要把自己当成面试官。

145. 专业技能要有侧重点

答:对于自己熟悉嘚技能要有自己的侧重点比如 spark 很熟,着重写spark的着重点写上简历的一定要会,否则面试官可能认为你在欺骗他

146. 是否有自己的博客,个囚的技术栈

答:一定要写这一项这一项说明你热爱技术,善于学习总结乐于分享,并且利用自己的业余时间投入到自己的事业当中

147. 專业技能,至少写的有层次感

答:分块写:比如 1) 按层次写 2) 比如hadoop 3) 实时计算 4) 机器学习 5) 编程语言等等

答:写清楚工作经历 每个时间段茬哪个公司工作,什么职位 项目名称: 写为 XXX公司XXX系统或平台(必须带上公司名称) 项目架构:写清楚使用到那些技术 比如 flume+kafka+hadoop+hbase+mapreduce+spark等等 总体人数:10囚 项目描述:根据项目解决问题一共有哪些功能写,功能不一定要写你都做过因为这里只是描述 责任描述: 你负责的模块,写大的功能不要写实现细节 解决问题:描述这个问题即可,怎么解决面试的时候去说 项目最好设计 以 storm spark mahout 相关

}

我要回帖

更多关于 小型工厂 的文章

更多推荐

版权声明:文章内容来源于网络,版权归原作者所有,如有侵权请点击这里与我们联系,我们将及时删除。

点击添加站长微信