3
19
2010
1

冰岩作坊2010年春季招新程序员面试题精选

冰岩作坊2010年春季招新程序员面试题精选

请先原谅我用标题来吸引大家的眼球,冰岩的招新其实很容易,也没有想象的那么的正式。面试过程中大家交流得最多的还是个人对互联网的理解,以及你的人品,性格。
不过,做程序的还是得肚子里面有点货。所以面试大家还是会拈几道关于程序的题目的。
题目一:url消重的问题
小馒头在鼓捣一个网络爬虫,第一阶段他抓取了一些url准备自己先分析下。
在他分析抓取的url的时候发现,有很多的url都是重复的,现在他要你帮他想一个策略如何消除这些重复的url?
这个问题可以说是写爬虫程序的时候第一个要解决的问题。因为一般的爬虫程序都是基于一个假设:万维网是树状的。这样可以使你的程序得到简化,但是也会有一个随之而来的问题,那就是实际上的万维网是网型结构,爬虫在某一个分枝往更深的节点爬行的时候,会在不知不觉中爬到以前的节点。这个时候就得采取某种策略来记录爬虫已经爬过了的url,不然爬行路径中就有很多的重复甚至是死循环。
题目二:提高存取效率策略
在我们用ajax做某些应用的时候,有些数据是之前已经请求过了的。这个时候,对于一些比较常用的数据,我们可以缓存在客户端,下次在请求的时候js程序先判断是否存在缓存,如果存在,就直接从缓存中读取,不存在则发送请求给服务器端,从而获取想要的数据。gogo正在弄的一个歌词播放器就是这样的。因为他发现很多歌词语句什么的有很多重复的,这个时候显示的歌词可以直接读自一个缓存。现在他要你帮他想一个解决方案,写一个缓存管理算法来帮助他管理歌词缓存。(比如,空间有限如何分配空间,如何优化缓存结构等)
我开始也没怎么明白这个问题的意思,后来才慢慢明白了。这实际上是要你想一个内存管理调度方案,服务器相当于你的外存,而他所谓的缓存就是你的“内存”,现在就是要你想一个算法来调度“内外存”来充分利用资源,尽可能减少io(http request请求)开销。
题目三:砝码盘问题
话说这个问题是一个非程序(小桂子)提问给一个女程序的问题。他们表述了半天最后也不知道是那位女程序太紧张了,还是没听明白,还是什么情况。反正最后是大家都迷糊了。我现在就把那个问题换一种表述吧。希望这次我能说清楚:
现在要你给一个量程为100g 精度为1g的天平配置一个砝码盘,要求使这个天平可以准确的称量1~100g的东西,问你如何配置砝码的重量分布,使满足题目要求的情况下,砝码数目最少,而且称量过程最简单。
比如说,你可以从1到100g的砝码各配置一枚。这样,称量某质量的物品时直接取对应的砝码即可。但是,这样砝码的数目就不是最少的了。(尽管称量过程最简单,只需要一个砝码即可)。
题目四:排序算法
这个题目我觉得是最简单的了。就是举例几个常见的排序算法,介绍下算法思想,时间复杂度啊什么的。

好久没有更新日志了,最近事情比较多,人也比较烦,一度想要放弃博客,但是,作为一个wwwer,虽然比较懒,还是慢慢抽空写下吧!
Category: 原hustnavy.cn | Tags:
1
19
2010
0

提高php代码的效率

发现有时候php的代码行数积累到一定的行数后,运行起来速度会变得慢下来。而php应用本来应该是高速高效的,这样就不是它的特性了,这里我从网上不知道哪里找到的一个关于提高php代码的效率的文章,贴在这里作为自己以后的参考吧!

最近在公司一边自学一边写PHP程序,由于公司对程序的运行效率要求很高,而自己又是个新手,一开始就注意程序的效率很重要,这里就结合网上的一些资料,总结下php程序效率优化的一些策略:

1.在可以用file_get_contents替代file、fopen、feof、fgets等系列方法的情况下,尽量用file_get_contents,因为他的效率高得多!但是要注意file_get_contents在打开一个URL文件时候的PHP版本问题;

2.尽量的少进行文件操作,虽然PHP的文件操作效率也不低的;

3.优化Select SQL语句,在可能的情况下尽量少的进行Insert、Update操作(在update上,我被恶批过);

4.尽可能的使用PHP内部函数(但是我却为了找个PHP里面不存在的函数,浪费了本可以写出一个自定义函数的时间,经验问题啊!);

5.循环内部不要声明变量,尤其是大变量:对象(这好像不只是PHP里面要注意的问题吧?);

6.多维数组尽量不要循环嵌套赋值;

7.在可以用PHP内部字符串操作函数的情况下,不要用正则表达式;

8.foreach效率更高,尽量用foreach代替while和for循环;

9.用单引号替代双引号引用字符串;

10.“用i =1代替i=i 1。符合c/c 的习惯,效率还高”;

11.对global变量,应该用完就unset()掉;

以上的策略所涉及的问题,我都在实践中遇到过,用了这些策略,效率提高了不少。试试吧。。。。

以下是一篇关于提高PHP效率的文章,很不错啦:

===================

 

<?php
class foo {
function bar() {
echo ‘foobar’;
}
}

$foo = new foo;

// instance way

$foo->bar();

// static way

foo::bar();
?>

 

静态地调用非 static 成员,效率会比静态地调用 static 成员慢 50-60%。主要是因为前者会产生 E_STRICT 警告,内部也需要做转换。

使用类常量 (PHP5 ONLY)

贴士:PHP 5 新功能,类似于 C 的 const。

使用类常量的好处是:

- 编译时解析,没有额外开销
- 杂凑表更小,所以内部查找更快
- 类常量仅存在于特定「命名空间」,所以杂凑名更短
- 代码更干净,使除错更方便

(暂时)不要使用 require/include_once

require/include_once 每次被调用的时候都会打开目标文件!

- 如果用绝对路径的话,PHP 5.2/6.0 不存在这个问题
- 新版的 APC 缓存系统已经解决这个问题

文件 I/O 增加 => 效率降低

如果需要,可以自行检查文件是否已被 require/include。

不要调用毫无意义的函数

有对应的常量的时候,不要使用函数。

QUOTE:
// PHP CODE Highliting for CU by dZ902

<?php
php_uname(’s’) == PHP_OS;
php_version() == PHP_VERSION;
php_sapi_name() == PHP_SAPI;
?>
虽然使用不多,但是效率提升大概在 3500% 左右。

最快的 Win32 检查

QUOTE:
// PHP CODE Highliting for CU by dZ902

<?php
$is_win = DIRECTORY_SEPARATOR == ‘\\’;
?>

- 不用函数
- Win98/NT/2000/XP/Vista/Longhorn/Shorthorn/Whistler…通用
- 一直可用

时间问题 (PHP>5.1.0 ONLY)

你如何在你的软件中得知现在的时间?简单,「time() time() again, you ask me…」。

不过总归会调用函数,慢。

现在好了,用 $_SERVER['REQUEST_TIME'],不用调用函数,又省了。

加速 PCRE

- 对于不用保存的结果,不用 (),一律用 (?

这样 PHP 不用为符合的内容分配内存,省。效率提升 15% 左右。

- 能不用正则,就不用正则,在分析的时候仔细阅读手册「字符串函数」部分。有没有你漏掉的好用的函数?

例如:

strpbrk()
strncasecmp()
strpos()/strrpos()/stripos()/strripos()

加速 strtr

如果需要转换的全是单个字符的时候,用字符串而不是数组来做 strtr:

QUOTE:
// PHP CODE Highliting for CU by dZ902

<?php
$addr = strtr($addr, “abcd”, “efgh”); // good
$addr = strtr($addr, array(‘a’ => ‘e’,
// …
)); // bad
?>

效率提升:10 倍。

不要做无谓的替换

即使没有替换,str_replace 也会为其参数分配内存。很慢!解决办法:

- 用 strpos 先查找(非常快),看是否需要替换,如果需要,再替换

效率:

- 如果需要替换:效率几乎相等,差别在 0.1% 左右。
- 如果不需要替换:用 strpos 快 200%。

邪恶的 @ 操作符

不要滥用 @ 操作符。虽然 @ 看上去很简单,但是实际上后台有很多操作。用 @ 比起不用 @,效率差距:3 倍。

特别不要在循环中使用 @,在 5 次循环的测试中,即使是先用 error_reporting(0) 关掉错误,在循环完成后再打开,都比用 @ 快。

善用 strncmp

当需要对比「前 n 个字符」是否一样的时候,用 strncmp/strncasecmp,而不是 substr/strtolower,更不是 PCRE,更千万别提 ereg。strncmp/strncasecmp 效率最高(虽然高得不多)。

慎用 substr_compare (PHP5 ONLY)

按照上面的道理,substr_compare 应该比先 substr 再比较快咯。答案是否定的,除非:

- 无视大小写的比较
- 比较较大的字符串

不要用常量代替字符串

为什么:

- 需要查询杂凑表两次
- 需要把常量名转换为小写(进行第二次查询的时候)
- 生成 E_NOTICE 警告
- 会建立临时字符串

效率差别:700%。

不要把 count/strlen/sizeof 放到 for 循环的条件语句中

贴士:我的个人做法

QUOTE:
// PHP CODE Highliting for CU by dZ902

<?php
for ($i = 0, $max = count($array);$i < $max; $i);
?>

效率提升相对于:

- count 50%
- strlen 75%

短的代码不一定快

QUOTE:
// PHP CODE Highliting for CU by dZ902

<?php
// longest
if ($a == $b) {
$str .= $a;
} else {
$str .= $b;
}

// longer
if ($a == $b) {
$str .= $a;
}
$str .= $b;

// short
$str .= ($a == $b ? $a : $b);
?>

你觉得哪个快?

效率比较:

- longest: 4.27
- longer: 4.43
- short: 4.76

不可思议?再来一个:

QUOTE:
// PHP CODE Highliting for CU by dZ902

<?php
// original
$d = dir(‘.’);
while (($entry = $d->read()) !== false) {
if ($entry == ‘.’ || $entry == ‘..’) {
continue;
}
}

// versus
glob(‘./*’);

// versus (include . and ..)
scandir(‘.’);
?>

哪个快?

效率比较:

- original: 3.37
- glob: 6.28
- scandir: 3.42
- original without OO: 3.14
- SPL (PHP5): 3.95

画外音:从此也可以看出来 PHP5 的面向对象效率提高了很多,效率已经和纯函数差得不太多了。

提高 PHP 文件访问效率

需要包含其他 PHP 文件的时候,使用完整路径,或者容易转换的相对路径。

QUOTE:
// PHP CODE Highliting for CU by dZ902

<?php

include ‘file.php’; // bad approach

incldue ‘./file.php’; // good

include ‘/path/to/file.php’; // ideal

?>

物尽其用

PHP 有很多扩展和函数可用,在实现一个功能的之前,应该看看 PHP 是否有了这个功能?是否有更简单的实现?

QUOTE:
// PHP CODE Highliting for CU by dZ902

<?php
$filename = “./somepic.gif”;
$handle = fopen($filename, “rb”);
$contents = fread($handle, filesize($filename));
fclose($handle);

// vs. much simpler

file_get_contents(‘./somepic.gif’);
?>

关于引用的技巧

引用可以:

- 简化对复杂结构数据的访问
- 优化内存使用

QUOTE:
// PHP CODE Highliting for CU by dZ902

<?php
$a['b']['c'] = array();

// slow 2 extra hash lookups per access
for ($i = 0; $i < 5; $i)
$a['b']['c'][$i] = $i;

// much faster reference based approach
$ref =& $a['b']['c'];
for ($i = 0; $i < 5; $i)
$ref[$i] = $i;
?>

QUOTE:
// PHP CODE Highliting for CU by dZ902

<?php
$a = ‘large string’;

// memory intensive approach
function a($str)
{
return $str.’something’;
}

// more efficient solution
function a(&$str)
{
$str .= ’something’;
}
?>

榨干 PHP,提高效率

Category: 原hustnavy.cn | Tags:
1
18
2010
0

推荐一个好知识管理工具--wizknowledge

很强大的一个知识管理工具,最近换回了ubuntu,一直在寻找类似ubuntu下的类似tomboy的便筏工具,很幸运让我找到了它。目前是免费的,支持类似tomboy的便筏,可以同步服务器,可以把便筏发布到wordpress的博客上,而且,可以它还有配套firefox的插件,可以把网页文字选中直接保存为便筏。

想想你用浏览器在互联网上冲浪的时候突然发现一篇好的文章,用鼠标选中它,右键点一下,就可以保存到本地,多么方便啊!

好了,废话不说了,点链接吧:http://cn.wizknowledge.com/

Category: 原hustnavy.cn | Tags:
1
18
2010
0

配置vim

开始配置 vim 我们对 vim 的配置分为几个步骤。 1,修改 vimrc 后自动生效 打开 $VIM 目录(我的电脑是/etc/vim) ,可以看到其中有一个 vimrc 文件,用 vim 打开此文件,删除所有内容后,在最后插入两行: ” autoload vimrc autocmd! bufwritepost vimrc source % 分号是配置文件的注释。 2,为编辑PHP代码进行基本设置 现在用vim打开.php文件看上去是很难看的,别说代码高亮,连行号都没有显示。所以还要给_vimrc添加以下内容: ” Enable syntax highlight syntax enable ” Show line number set nu ” show matching bracets set showmatch ” Basic editing options set expandtab set shiftwidth=2 au FileType html,python,vim,javascript setl shiftwidth=2 au FileType html,python,vim,javascript setl tabstop=2 au FileType java,php setl shiftwidth=4 au FileType java,php setl tabstop=4 set smarttab set lbr set tw=0 “Auto [...]

Category: 原hustnavy.cn | Tags:
1
18
2010
1

配置php

因为换系统的原因,已经有两周多没工作了。所以当刚熟悉了一点ubuntu就赶紧重新配置了下php的开发环境。 1,下载xampp 之所以选择xampp主要是因为它集成了php5 mysql5apache,这样就比自己一个一个的安装配置它们快多了。因为我现在没时间去一个个的摸索ubuntu下配置它们的方法,我要的是能在最快的时间内恢复工作环境。安装了xampp基本上完成了大半,不过,还是有点问题,那就是: hustnavy@hustnavy-laptop:~/lampp$ sudo ./lampp startcat: /opt/lampp/lib/VERSION: 没有该文件或目录./lampp: line 120: /opt/lampp/share/lampp/selinux: 没有该文件或目录 我把lampp解压到了我的home目录下,结果在启动的时候报这个错。 /opt/下当然没有lampp这个目录了。没办法,ubuntu毕竟还是不够人性化,没有这个目录的话那我就自己建个软链接呗。 解决方法: cd /opt ln -s /home/hustnavy/lampp lampp 这样就可以启动xampp了 不过,还是建议以后安装的时候直接解压到/opt/目录下,不然还得改很多东西。 2,选择ide (eclipse or vim?) 以前win7的时候用的是eclipse ,对它的自动补全,以及源文件outline这些东西感觉很是爽!不过换ubuntu之前听说ubuntu下面最好的开发编辑器是vim,我也想换换ide于是就先配置了下vim。 vim的配置应该写专门的一篇的,放在这里有点不合适,所以,我就把它单独出来。 vim配置php开发ide. 不过用了一段时间后,虽然vim也很爽,不过感觉还是没有eclipse爽,毕竟自己用上手了的东西,突然换确实有点不适应。 还是去找了eclipse for linux(pdt),因为eclipse是基于jdk运行时环境的(也就是jre),所以,把eclipse的包解压了还不行,还得配置jre环境,不过,我是直接把jdk给安装了,因为考虑到以后还会用java。 安装完成后应该就到此为止了,不过,我得先说下。ubuntu下的eclipse兼容性存在问题,尽管有那么多方便,不过却和scim兼容不好,具体表现就是,你写代码写着写着,这时候就突然无法输入了,我当时很是郁闷了半天。开始对ubuntu下的eclipse很满意的,因为和自己原来的开发环境差不多,有一种很熟悉的感觉。 不过,今天我得给出ubuntu下我的第一句名言了:ubuntu下没有问题,只是你没有解决问题的能力。无法输入?这不是问题,只是你现在还太菜,不知道怎么解决罢了。google之,找到了一个暂时的解决方法: eclipse输入法问题 eclipse输入的时候会不间断的出现无法输入的情况,我用的是scim,解决方法是 input method ->scim bridge。。 就是在你的工作面板(编辑代码的地方)右键,这时候会出来一个菜单,选择input method ->scim bridge,就可以了。 然后还有另外一个问题,就是权限的问题。就是说eclipse的workbench的读写权限,这个问题还比较好解决,直接chown就可以了。

Category: 原hustnavy.cn | Tags:

Host by is-Programmer.com | Power by Chito 1.3.3 beta | Theme: Aeros 2.0 by TheBuckmaker.com