2006/11/20, Jos van den Oever &lt;<a href="mailto:jvdoever@gmail.com">jvdoever@gmail.com</a>&gt;:<div><span class="gmail_quote"></span><blockquote class="gmail_quote" style="border-left: 1px solid rgb(204, 204, 204); margin: 0pt 0pt 0pt 0.8ex; padding-left: 1ex;">
2006/11/20, Mikkel Kamstrup Erlandsen &lt;<a href="mailto:mikkel.kamstrup@gmail.com">mikkel.kamstrup@gmail.com</a>&gt;:<br>&gt; &gt; This notion of groups is very valuable for a nice user interface. It<br>&gt; &gt; is however not relevant for the simplest form of search engine. The
<br>&gt; &gt; group designation of a file is usually not stored directly in the<br>&gt; &gt; database, but inferred over the mimetype. For complex groups the query<br>&gt; &gt; might look something like (application/msword OR application/pdf OR
<br>&gt; &gt; ...). Making such a list part of a search API makes it hard to agree<br>&gt; &gt; on the mimetypes. I do not oppose a wrapper API the knows about the<br>&gt; &gt; groups and expands a group-enabled-query, but I dont think we should
<br>&gt; &gt; put this in the simple API. The group(s) to which a file belongs is<br>&gt; &gt; just another type of (inferred) metadata and i dont think we should<br>&gt; &gt; treat is specially.<br>&gt;<br>&gt; Given that it would be part of the search language it cannot be ruled out of
<br>&gt; the simple api, unless we restrict the simple api to only support a subset<br>&gt; of the query language (which I don't think is a good idea).<br>Another generalization one usually make is that default search fields
<br>are used. How do we define those, do they depend on document type or<br>group?<br>I'd prefer the query to be as specific as possible, but I dont expect<br>the user to have to type a specific query. The application expands the
<br>query to one that fits in the context.<br><br>&gt; It could be introspectable which switches was supported in the language,<br>&gt; such as a GetSupportedQuerySwitches(out as), but that doesn't seem to fit in<br>&gt; a &quot;simple&quot; api.
<br>&gt;<br>&gt; Also what about items that don't have a mimetype as such, conversations,<br>&gt; emails, attachment, contacts, etc. How would an application search my<br>&gt; Contacts for &quot;Jos&quot;? If this called for an advanced api, that seems strage..?
<br>Each indexed object must have an identifier, a uri, that points to it<br>and that can be interpreted. If you look in files this is easy. If you<br>look for contacts, you'll need to have a different url. You can match<br>
on this url to specify a subset of data to search in. E.g. something<br>like this (oversimplified) 'path:urn://contact/*'.<br><br>The API defined so far returns uris for results. This is an important<br>point. Not the resulting objects are returned but a pointer to them.
<br><br>&gt; My concern is that we limit the simple api too much to be of any real value.<br>Lets hope not!<br>To recoup, essentially we've not added functions or changed anything<br>significant yet. Only the get/showConfiguration change. Am I correct
<br>that so far you've been swayed by my arguments? If not please repeat<br>the problematic points.<br><br>Also I hope others are reading this too. Dont want to end up with a<br>two-man-standard.</blockquote><div><br><br>
That would be a darn shame :-) Give me until tomorrow to give this api some hard thinking. I also think we should
personally email all the maintainers of any framework we can come up
with, and set a response deadline within a week or so..?<br>&nbsp;</div><br><blockquote class="gmail_quote" style="border-left: 1px solid rgb(204, 204, 204); margin: 0pt 0pt 0pt 0.8ex; padding-left: 1ex;">A point I forgot in the first API: what about returning text fragments
<br>that show the matches in the documents?</blockquote><div><br>That is certainly a handy feature (and utilised in most search tools nowadays), so it might prove worthwhile to add. The question is whether it should take an array of uris or only a single uri...
<br></div><br><div><br><br>Cheers,<br>Mikkel<br></div><br></div><br>