长理培训真题库
我的
军队文职考试一本通

2014年百度校园招聘软件研发工程师笔试题

2020-07-16 21:31
2014 年百度校园招聘软件研发工程师笔试题 一,简答题(本题共 30 分) 1. 当前计算机系统一般会采用层次结构来存储数据,请介绍下典型的计算机存储系统一般 分为哪几个层次,为什么采用分层存储数据能有效提高程序的执行效率?(10 分) 2. Unix/Linux 系统的僵尸进程是如何产生的?有什么危害?如何避免?(10) 3. 简述 Unix/Linux 系统中使用 socket 库编写服务器程序的流程,请分别用对应的 socket 通信函数表示。 二,算法与程序设计题(本题共 45 分) 1, 使用 C/C++语言写一个函数,实现字符串的反转,要求不能用任何系统函数,且时间 复 杂度最小。函数原型是:char *reverse_str(char *str)(15 分) 2, 给定一个如下输入格式的字符串,(1,(2,3),(4,(5,6),7))括号内的元素可以是 数字,也可以另一个括号,请实现一个算法消除嵌套的括号。比如把上面的表达式变成: (1,2,3,4,5,6,7),如果表达式有误请报错。(15 分) 3, 相似度计算用于衡量对象之间的相似程度,在数据挖据,自然语言处理中使一个基础 性 计算,在广告检索服务中往往也会判断网民检索 Query 和广告 Adword 的主题相似度。 假设 Query 或者 Adword 的主题属性定义为一个长度为 10000 的浮点数据 Pr[10000] (称之为主题概率数组),其中 Pr[i]表示 Query 或者 Adword 属于主题 Id 为 i 的概率,而 Query 和 Adword 的相似度简化定义为两者主题概率数组的内积,即 sim(Query,Adword)=sum(QueryPr[i]*AdwordPr[i])(0<==i<10000).在实际应用场 景中,由于大多数主题的概率都为 0,所以主题概率数组往往比较稀疏,在实现时会以一 个紧凑型数组 topic_info_t[]的方式保存,其中 100<=数组大小<=1000,并按照 topic_id 递增排列,0<=topic_id<10000,0 现在给出 Query 的 topic_info_t 数组和 N(N>=5000)个 Adwords 的 topic_info-t 数组, 现要求出 Query 与 Adwords 的相似度最大值,即 max(sim(Query,Adword[i])(0<=i& query_topic_info, Const vector adwords_topic_info[], Int adwords_number); 编写代码求时间复杂度最低的算法,并给出时间复杂度分析。(15 分) 三,系统设计题(本题共 25 分) 在企业中,对生产数据进行分析具有很重要的意义。但是生产数据通常不能直接用于数据 分析,通常需要进行抽取,转换和加载,也就是业界常识的 ETL
温馨提示:如果当前文档预览出现乱码或未能正常浏览,请先下载原文档进行浏览。
2014年百度校园招聘软件研发工程师笔试题 第 1 页

下载提示

1 该文档不包含其他附件(如表格、图纸),本站只保证下载后内容跟在线阅读一样,不确保内容完整性,请务必认真阅读

2 除PDF格式下载后需转换成word才能编辑,其他下载后均可以随意编辑修改

3 有的标题标有”最新”、多篇,实质内容并不相符,下载内容以在线阅读为准,请认真阅读全文再下载

4 该文档为会员上传,版权归上传者负责解释,如若侵犯你的隐私或权利,请联系客服投诉

最近更新

热门排行