среда, 16 декабря 2009 г.

Работа

Вчера читал свежий номер журнала F5. Главной темой номера были удалённая работа, фриланс и аутсорсинг.

Одна из цитат не даёт мне покоя:
"Как в электронный век можно заставлять человека ехать в офис, чтобы сесть за компьютер?!"
По-моему, это - гениально.

В последнее время я часто задумываюсь о том какое имеет значение место где мы находимся. Уже четвёртый год я живу и работаю в Москве. За эти четыре года родная Белоруссия изменилась настолько, что теперь россияне говорят о Минске не "застывший кусок СССР", а - "развивающийся кусочек Европы".

А в Москве за это время успели понастроить около 20 торгово-развлекатльных быдломагазинов, увеличить пробки в 10 раз и открыть один центр современного искусства.

В крупных компаниях люди (в том числе, разработчики) распределяют рабочее время примерно так:
  • 30% - поглощать накопленное в сети информационное говно
  • 20% - почесать языком с умным видом (не двигая дело с места)
  • 12% - пожрать
  • 12% - покурить
  • 8% - кофейные перерывы
  • остальное - работа

Такие дела.

А месяца два назад менеджер с женой переехал в Таиланд, колесит там везде, в перерывах модерирует пользовательский контент за московские копейки.


И вот думается, какую ценность несут все эти блага мегаполиса?

Эволюция ссылок

Недавно обратил внимание на отличный вид спама в комментариях.
Вот например: http://www.yandex.ru (кликайте, не стисняйтесь)

Класс, правда? :-)
Это всё наша привычка считать, что по ссылке будет именно то, что на ней написано. Укоротители урлов и такого рода шутки ломают эту привычку. Что ж, нужно её спасать!

Мне кажется, спустя 40 лет гипертексту пора эволюционировать.
40 лет ссылка состояла из двух частей - адрес и её контент, поясняющий смысл ссылки. А почему бы не оставить только адрес?

С 1965 года технологии шагнули довольно далеко и содержимое ссылки можно формировать автоматически. И, пожалуй, то о чём я говорю очень похоже на сервис www.snap.com. Но проблема этого сервиса в том, что он выглядит назойливым. Пользователей отвлекают и раздражают все штуки, которые начинают жить своей жизнью пока их не попросили об этом.

Мне кажется, то о чём я говорю проще показать.
Ниже скриншоты мэшапа на основе твиттера:

Сайт ходит по ссылкам и делает мини-копии картинок, хештеги, ретвиты помечаются картинками и цветом. Это делает твит более читабельными и информативным.


Кстати Твиттер начал обрабатывать RT в своём интерфейсе, что доставляет.

Собственно говоря, я о том, чтобы ссылки говорили о себе больше, чем хотел автор этой ссылки.

понедельник, 14 декабря 2009 г.

Поиск. Google. Яндекс.

Все наверняка задумывались в чём секрет релевантности Гугла.
Вся эта морфология, ранжирование и индексирование.

Мне когда-то казалось, что самое важное - это правильно отпарсить текст и ссылки посчитать. Посмотреть что в заголовке, количество слов, формулы рассчитать.

А ведь на самом деле всё может быть проще и интереснее.
Ведь можно основываться на поведении пользователя и опираться на статистику.

Пожалуй, лучше на примерах:
  1. Тематики запросов.
    Почему по запросу "tomato" Гугль мне первым подсовывает страницу о разработке и IT? Потому что, чуть более чем все мои запросы на эту тему. Я - веб-разработчик и вряд ли буду искать описание помидора.

    Теперь я в категории "веб-разработка" и результаты поиска соответствующие.

  2. Уточнение запросов
    Если на первой-второй странице человек не находит то, что искал (например, ссылку на википедию), то он уточняет запрос. Это также весомый аргумент, чтобы изучить что же ожидалось увидеть.

  3. Статистика кликов
    А теперь добавим к этому статистику кликов по результатам и количество возвратов к выдаче. Итак, уже можно поднимать какие-то строчки выше - люди в данной категории находят нужную информацию именно там.

  4. Внешние источники статистики
    Вы замечали кнопки "Share this"?
    Большинство этих кнопок замеряют время, которое прошло с момента прихода на страницу и до момента клика на "Добавить в закладки/Посоветовать другу". Полученные данные отправляются на нужные сервера.

    Можно считать, что если прошло более 30 секунд (вы читали) и нажата кнопка (материал полезен), то материал действительно полезен.

  5. Важные куски текста
    К примеру, на странице много текста. Ключевые слова часто повторяются и толком не понять спам это или полезный текст.

    Хм, а что если поставить надстройку над браузером и собирать инфу о выделении текста и копировании? Вы когда-нибудь выделяли баннер или копировали спам-текст? Только ради прикола, согласитесь :-)
Все действия пользователя намного важнее количества текста, тегов и прочих хреней, известных лишь разработчикам. Поведение человека относительно запроса рассказывает намного больше, чем формулы.

Можно набрать в отдел поиска 100 супер-крутых разработчиков и получить хороший индекс. А можно 10 супер-крутых социологов и психоаналитиков и получить - релевантную выдачу.

Первый

Бывают лезут всякие мысли в голову.
О разработке интернет-проектов. Буду их тут писать.